运城网站建设公司百度建设自己的网站

张小明 2026/1/1 7:17:51
运城网站建设公司,百度建设自己的网站,wordpress文章页特色,企业电子商务网站设计的原则本文分享了作者从RAG到AI Agent开发的3个月实战经验#xff0c;详细记录了使用FastAPIOpenSearch大模型构建Agent系统的踩坑历程#xff0c;包括环境配置、模型选择、查询优化、提示词调试等关键技术挑战。作者通过对比开源框架与自研方案的优劣#xff0c;总结出了一套适合…本文分享了作者从RAG到AI Agent开发的3个月实战经验详细记录了使用FastAPIOpenSearch大模型构建Agent系统的踩坑历程包括环境配置、模型选择、查询优化、提示词调试等关键技术挑战。作者通过对比开源框架与自研方案的优劣总结出了一套适合业务需求的Agent开发方法论并揭示了其与推荐系统相似的召回-排序-重排序架构模式为AI Agent开发者提供了宝贵的实战参考。2021~2025年开始的大模型疯狂急速迭代RAG概念问世还没有尝试如今AI Agent变得热火朝天当然也可能火热了很久只是自己落伍了才刚开始接触。于是乎也来凑个热闹尝试一下agent开发。说实话除了迷茫还是迷茫。这篇可能是非干货水文。前言一个项目磨磨唧唧做了几个月从开始的开源低代码workflow框架RAGflow、dify再到后来完全自行开发。之间完全没有感觉到痛苦有的只有心虚与迷茫。心虚的是担心这个程序上线后崩盘迷茫的是处处都是坑哪个坑都没整明白。系统主要功能采集内容到知识库用户提问或提供关键词或句子根据2用户提问搜索知识库中内容根据3搜索到知识库中内容大模型进行总结。感悟好像各种类似的项目都可以按照这个逻辑来做只需要修改知识库、提示词和业务相关的规则。不知道是不是我的错觉【笑】。环境准备这里不详细介绍了全是官网下载安装即可1、python3.12Fastapi开发web项目2、mysql用于存储元数据包括用户、预设、配置等等。3、OpenSearch(或elasticsearch)这俩开源协议貌似有些许差别向量构建和搜索有区别其他差不多。4、一个大模型服务(qwen和deepseek)本地部署或者直接购买厂商服务。5、ollama部署本地向量模型bge-m3和意图识别对话小模型qwen3到ollama官网查看支持具体模型的名字和版本号。小坑1ollama对话模型直接命令启动即可例如ollama run qwen3。bge-m3是向量模型不需要启动执行命令(ollama pull bge-m3)下载模型后请用如下命令测试是否可用出现1024维向量即可。GPU机器好贵用CPU会慢并且会拉满CPU使用率。curl http://127.0.0.1:11434/api/embed -d {model: bge-m3:567m, input: [hello world]}小坑2如果使用deepseek-r1深度思考模型json格式化输出遇到了小问题可能是自己提示词用的不好json输出很难控制。deepseek-v3和qwen3通过提示词来json格式化输出比较容易。 小坑3fastapi要不全用同步框架开发要不都用异步框架。异步接口使用同步方法这种混用后出现了一个接口卡死了整个服务。这里是自己业务不精了对python和fastapi框架没有进行深入的学习。系统架构看了一些ragflow框架源码。感觉自己做的agent架构太过于朴素这也是对系统没有信心的原因。不过吧越简单可能错误越少呢是不数据服务将数据进行清理、结构化、向量化后写入存储层。存储层大坑1大坑是目前没有很好解决的。一是OpenSearch配置合适的数据滚动策略因为向量数据增长迅速内存很难无限增大一部分数据一定会放到磁盘影响查询速度。二是适合业务的高效准确的查询策略如何保证查询准确率主观判别或客观的验证方法是什么三是词、向量和其他筛选条件的权重如何调试平衡使查询到结果符合业务要求redis需要快速读取频繁访问的数据。Mysql用户、登录、访问等基础信息。OpenSearch(或elasticsearch)数据服务写入结构化数据(文本等)和向量这是知识库主要存储。ollama(bge-m3)向量服务图片里拼写错了【哭】。bge-m3模型支持多语言向量1024维归一化后的可以直接用于余弦相似度计算。接口服务选择合适的web开发框架注意前文的提到的小坑3。比较麻烦的是大模型流式输出一般是用sse协议markdown文本格式目前聊天类服务如deepseek等很多用该格式目前前端展示处理markdown有成熟框架大模型生成markdown也很方便。大模型服务选个用着方便的如deepseekqwen豆包等等吧。小坑4接口响应速度和并发都是问题不过问答类输出内容速度可以慢一点以使用各种大模型来看输出慢一点是可以接受的。踩坑经验尝试ragflow构建RAG、agent的开源框架支持workflow知识库构建提供api服务。不符合当前业务的点服务无法横向扩展提升系统并发。当前业务场景需要需要新数据提升展示权重这里做不到。构建词、语义相似度搜索再加上一些条件筛选很难做到。OpenSearch向量存储占用内存很大需要调整配置向量float型转成byte可以减少3/4用量尽量把数据放进内存提升查询速度。从磁盘查询需要几十秒才能返回结果用户受不了。提示词用大模型服务(deepseek等)去生成提示词生成后在实际场景中查询使用再根据结果将原提示词和修改意见再放回大模型服务进行调整。不断循环调试。尝试意图识别为了获取更好的查询结果和查询速度首先将用户提问进行意图识别和分类再执行相应的操作。真的好难。采用向量相似度进行意图识别准确率待验证。使用大模型意图识别会影响接口响应速度同样有准确率问题需要调整意图描述和识别意图的提示词。无用的小tips给自己留的笔记opensearch的数值(时间、距离、价格等)衰减函数(gauss,lin,exp)参数说明衰减函数会把给定的origin范围内的数据提升查询分数更容易展现在眼前。查了官方文档和看了一些博客一直没看懂尝试了一下确定了分数计算方式。originscore1的点offsetorigin - offset value origin offset这时候score1scale:1origin - scale value origin - offset 和 origin offset value origin scale时score的值按照所选函数衰减(如gauss)2在valueorigin - scale 和value origin scale这2个点时scoredecay3在value origin - scale 和 value origin scale 时score按照函数衰减(如gauss)decay衰减值总结希望项目能迭代几次得到用户的反馈能将开发中不明确的问题弄清楚并解决。 在开发过程中感觉特别像曾经接触过的推荐系统流程如下 1. 召回从巨量数据知识库中检索到少量数据这里是opensearch查询 2. 排序根据召回结果进行排序这里是opensearch分数排序再一次减少数据量 3. 重排序手写程序规则或重排序模型再次进行排序获取更少的数据 4. 将最终结果列表给到用户AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2025最新大模型全套学习资源》包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

成都电子商务平台网站制作报价建筑工程公司名字

临近毕业,好多学弟学妹都在问:有没有免费的降AI率工具? 一篇论文动不动10000、20000字,查重、查AI率、降重、降AIGC率,再查一次AIGC率。从写好论文到最后通过查重,最起码得好几百。 对学生来说&#xff0…

张小明 2025/12/30 3:59:16 网站建设

360免费建站网址是什么域名不定更换

Qt插件开发全解析 1. 插件基础概述 Qt提供了丰富的编程接口,能够与多种不同技术进行交互,这使得基于Qt的应用程序在不同平台上呈现出不同的外观。同时,借助Qt的插件功能,我们可以创建自己的新特性。 在Qt中,处理插件的类不仅可用于扩展Qt本身,还能创建自定义的插件接口…

张小明 2025/12/30 3:59:13 网站建设

全国最大的网站建设公司网站建设的几个阶段

Venera:重新定义跨平台漫画阅读体验 【免费下载链接】venera A comic app 项目地址: https://gitcode.com/gh_mirrors/ve/venera 你是否厌倦了在不同设备间切换阅读漫画的繁琐?手机上的精彩情节无法在电脑上延续,平板上的收藏列表在手…

张小明 2025/12/30 3:59:11 网站建设

公司关于网站建设的通知zencart 网站安装

深入解析 fwsnort 与 psad:网络安全防护的强大组合 在网络安全防护的领域中,fwsnort 和 psad 这两款工具发挥着重要的作用。fwsnort 能够依据 Snort 规则集生成 iptables 规则,从而实现对网络攻击的检测与防范;psad 则具备检测、告警和自动响应等功能。本文将详细探讨如何…

张小明 2025/12/30 3:59:08 网站建设

网站建设采购项目合同书宿州市网站建设有哪些公司

在当今全球化的数字世界中,处理中日韩多语言字体显示问题已成为开发者和设计师的日常挑战。Source Han Sans TTF 作为一款专业的开源中日韩字体,能够彻底解决多语言字体兼容性难题,为你的项目提供完整的字体配置解决方案。 【免费下载链接】s…

张小明 2025/12/30 3:59:06 网站建设

怎么做网站关键字网站开通时间查询

在大坝形变监测中,单北斗GNSS系统凭借其高精度和实时监测能力,成为重要的技术支撑。该系统通过北斗形变监测传感器,能够精准检测大坝的位移和变形,为安全保障提供可靠的数据支持。单北斗GNSS的工作原理依托卫星定位技术&#xff0…

张小明 2025/12/30 5:18:57 网站建设