西丽网站的建设网络工程师岗位-沈阳市网站建设公司-Seo优化

西丽网站的建设,网络工程师岗位,怎么免费从网站上做宣传,wordpress社交媒体插件01 神经网络1#xff0c;神经元#xff1a;神经网络的最小单元神经网络的灵感来源于人类大脑的神经元#xff0c;每个神经元就像一棵 “小树”#xff0c;树突接收其它神经元的信号#xff0c;细胞体处理信号#xff0c;轴突把处理后的信号传给下一个神经元。生物神经元示…01 神经网络1神经元神经网络的最小单元神经网络的灵感来源于人类大脑的神经元每个神经元就像一棵 “小树”树突接收其它神经元的信号细胞体处理信号轴突把处理后的信号传给下一个神经元。生物神经元示意图数字世界的人工神经网络的基本单元是人工神经元工作原理与人脑神经元类似但更简单用数学公式代替了生物反应输入接收多个 “信号”比如文字转化后的数字信息每个信号有一个 “权重”类似神经元连接的强弱计算将输入信号乘以权重后相加再通过一个 “激活函数”决定是否 “激活”输出信号输出激活后的结果传递给下一层神经元。举个例子假设你去买肉决定是否买肉的过程就是一个人工神经元的简化版输入肉的价格x1、新鲜度x2、你口袋里的钱x3权重你对每个因素的在意程度比如价格的权重是 0.5新鲜度是 0.3钱包余额是 0.2计算价格 ×0.5 新鲜度 ×0.3 余额 ×0.2得到一个总分数激活函数设定一个 “购买阈值”比如总分数超过 60 分就买。如果总分数≥60激活函数输出 “买”否则输出 “不买”。人工神经元示意图2神经网络处理复杂问题单个神经元只能做简单的判断要处理复杂问题需要多层神经元连接起来才行。生物神经网络就是很多个神经元组合在一起。人脑神经网络图片同样的人工神经网络也是由很多人工神经元组成的。人工神经网络示意图神经网络通过神经元层层计算下一层的神经元的计算参数是基于上一层神经元计算后传递的数值最终输出结果。比如处理猫的图片输入层接收图片像素信息每个像素点对应一个输入神经元神经网络通过运算最后输出层输出识别结果这张图片为猫的几率是百分之多少。人工神经网络的计算非常简单就是计算每个节点上的人工神经元的函数。假设将神经元上的函数设置为Y a * X b。那么函数的参数就是2个a、b最开始可以随机设置函数参数假如将第一个神经元的函数参数设为a2、b3或者根据经验设置具体数值第一个神经元的函数就是Y 2 X 3。其它神经元的函数参数设置也是类似的。参数设置成什么数值不重要后面这些参数会变动。还是以上面的猫为例假设计算各个神经元的函数后最后得出猫的几率为90%。但是我们知道这张图片猫的几率为100%这个时候我们按照神经网络中相反的方向从倒数第一层开始告诉倒数第二层你的结果错了应该是100%需要调整你这个神经元的函数参数依次类推一直将信息传递到第一层的神经元。这时候整个神经网络从最后一层开始修改函数参数一直到第一层。那么第一个神经元的函数参数就可能被从原来的2、3修改成4、5。函数被改为Y 4 X 5。然后再让神经网络处理同一张猫的图片假设第二次计算的结果是猫的几率为95%。重复文章前面两段中提到的反向传递信息的步骤每个神经元继续更改函数参数。不停地重复这个循环。假设重复到一万次后计算得出猫的几率为99.9999%我们认为再计算下去已经没有意义浪费时间和电费就可以停止了。以上就是人工神经网络的训练过程。3循环神经网络RNN在处理语言时句子中的文字顺序很重要比如 “猫吃老鼠” 和 “老鼠吃猫” 意思不同但是早期的神经网络无法处理这种顺序关系。于是专门处理序列数据的循环神经网络诞生了。循环神经网络示意图循环神经网络最大特点是网络中存在着环使得信息能在神经网络中进行循环从而实现对序列信息的处理。RNN 的每个神经元处理完一个词后会把当前的 “状态”比如对前文的理解传递给下一个词。比如处理 “我明天要去” 时处理 “我” 后记住 “主语”处理 “明天” 时结合 “时间”处理 “去” 时知道 “动作”最终预测下一个词可能是 “哪里”“广州” 等。循环神经网络就像玩传话游戏每个人传话给下一个人的时候多加一个字。当字数比较多的时候后面的人已经忘了前面的人开始说的话可能只记得最后几句话。另外只能在一个链条处理信息不能同时处理所有信息。现在轮到Transformer出场了因为循环神经网络的两个缺陷它刚好都能解决。02 TransformerTransformer架构是Google团队在2017 年的论文《Attention Is All You Need》中提出的。Transformer是个很复杂的神经网络架构架构图如下其中最核心的创新就是橙色模块的多头注意力机制。Transformer模型架构图Transformer的架构图如果不是专业人士不用搞懂。我们来说说它最核心的模块多头自注意力。先说什么是自注意力机制。以句子“这只猫很可爱因为它毛茸茸的”为例。打个比喻吧想象一下这句话里所有的词都坐在一张圆桌旁开会。当处理其中一个词比如“它”时允许“它”环顾整个圆桌看向句子里的所有其它词并问“你们谁对我理解自己的意思最重要”“它”会给其它词打分可能会给“猫”打很高的分因为“它”指代“猫”。给“毛茸茸的”打较高的分解释了“可爱”的原因。给“可爱”打一定的分。给“这”、“只”、“很”、“因为”等词打较低的分。然后“它”会把这些分数转换成参数计算一个所有词的“加权平均值”。这个平均值包含了整个句子中对理解“它”最有用的信息。这样“它”就能准确知道自己是代表“猫”并且和“毛茸茸的”非常相关。多头注意力就像一个会议有多个小组同时讨论不同方面如一组讨论指代关系一组讨论情感一组讨论动作Transformer通常有多个注意力头并行工作各自关注句子不同层面的信息然后将结果合并让理解更全面。基础知识先讲这么多下面来说说AI大语言模型训练的主要过程预训练、监督微调、奖励模型、强化学习。注意我这里讲的是主要过程并不是说训练过程只有这些步骤。03 预训练预训练需先收集训练用的语料。在网络上抓取海量的网页、社交媒体平台的信息、知识百科、代码、书籍等作为训练语料。训练的方法跟上文中神经网络识别猫那个例子差不多只不过这里要换成文本。比如有一句话今天是个大晴天。训练的时候给出“今天是个大晴”然后让AI推测下一个词如果猜的不是“天”那就调整模型参数。通过万亿级文本、几个月的训练可能耗费的电量比一个城镇一年的用量都还要多Transformer 的参数被调整到能捕捉人类语言的几乎所有规律最后得到了一个基础模型。04 监督微调预训练之后的大模型是个知识全才的学生但是它不会解题。这个时候通过人类告诉大模型标准答案比如告诉大模型日常聊天要使用口头语写论文要用书面语言和专业术语告诉大模型怎么写邮件等等。大模型通过学习这类正确的例子学会正确的解题方法。这些正确的例子都是人工编排出来的相较于预训练时海量的、低质量的文本数量不会很多通常几万条但质量更高。监督微调这一步的主要作用是让AI按照人类的方式回复输出的内容更有针对性、更加相关、格式更加规范。如果大语言模型学习太多的标准答案模型可能为了模仿标准答案显得过于刻板或缺乏创造力。这就引出了后面的强化学习。05 奖励模型在强化学习之前我们先要造一个奖励模型一个能自动判断AI回答好坏的打分器。奖励模型是一个比较小的模型目的是替代昂贵的人工去评价无数回答。首先要收集偏好数据向基础模型或微调后的模型输入大量不同的问题。让模型对每个问题生成多个通常是2-4个不同的答案。再由人类查看这些回答判断哪个回答的更好更安全、更有帮助、更真实、更无害、更流畅等。这个环节人类不写标准答案只做比较。通过训练让这个奖励模型学会模仿人类的偏好判断。具体来说对于人类认为更好的回答奖励模型给出更高的分数对于更差的回答给出更低的分数。06 强化学习在强化学习阶段大模型变成了一个游戏玩家。每次生成回答后奖励模型给它打分高分像游戏中的金币低分像扣分。模型通过算法调整参数让未来的回答更可能拿到高分。比如生成友好且信息丰富的回答时得分高模型会增强与这类回答相关的参数权重。比如生成生硬或错误的回答时得分低模型会减弱相关参数的影响。这一轮的训练完成后AI大语言模型就基本上可以回答高质量的答案了。今年发布的很多头部大模型就是在这个环节加大了训练量让大模型的质量明显提升。DeepSeek今年的迭代主要是加强了强化学习这个环节。07 文本生成当你用DeepSeek的时候你会发现它是一个词一个词的呈现的是AI在故弄玄虚吗亦或是故意拖延时间来更好地生成答案并不是大语言模型的本质就是玩词语接龙的游戏。在神经网络和预训练的章节里大家已经知道AI是怎么做预训练的了。同样的生成文本的时候AI根据你写的提示词然后预测下一个词。然后根据提示词生成的词继续预测下一个词。是的AI就是这么循环工作的。这也就是为什么你看到的是一个词一个词的呈现因为实际它就是这么工作的呀。因此优质的提示词非常重要优质的提示词能激活神经网络中的某些区域让你获得更优质的答案。08 涌现最后再说一下为什么做了一些数学计算AI就能写文章、写程序代码。人工神经网络的计算每一层人工神经元到底起了什么作用目前没人知道这是个黑箱算法。有人认为是在进行特征提取可能吧。人工神经网络与人类大脑的神经网络也不太一样它将记忆储存在神经元的参数里。而人类大脑的记忆并不是储存在神经元里的。从生物学的角度去看有个词叫“涌现”。描述了在复杂系统中由大量个体通过相互作用产生的新属性、行为或结构这些特性是其组成部分本身所不具备的。例如蚁群中每只蚂蚁的行为都非常简单基本上都是通过分泌、识别信息素做出反应没有任何智慧可言。但是当成群的蚂蚁在一起时整个蚁群就展现出了高度的协调比如建巢、找食、合作捕猎等。AI大模型也是一样大量的数学计算最后涌现出了智能。09 零基础入门AI大模型必看陆陆续续也整理了不少资源希望能帮大家少走一些弯路无论是学业还是事业都希望你顺顺利利 1️⃣ 大模型入门学习路线图附学习资源2️⃣ 大模型方向必读书籍PDF版3️⃣ 大模型面试题库4️⃣ 大模型项目源码5️⃣ 超详细海量大模型LLM实战项目6️⃣ Langchain/RAG标题一/Agent学习资源7️⃣ LLM大模型系统0到1入门学习教程8️⃣ 吴恩达最新大模型视频课件

西丽网站的建设网络工程师岗位

高端网站定制设计公司手机排名

网站开发工程师岗位要求网站发送邮件连接怎么做

厦门市网站建设公司中国建设银行网站首页怎么销户

什么是软文写作长春百度搜索排名优化

禹城网页定制做网站优化企业

响应式网站模板的应用沈阳公司网站