当前文档和【权重的训练】章节有部分重复,因而废弃。大量内容已经迁移到其他文档中,少量未迁移。做存档保存。

名词

神经网络、神经元、权重、偏置、激活函数

AI 大模型如何工作?

AI 大模型,通过【神经网络】进行复杂的计算并输出结果。

【神经网络】内部有 N 个神经网络层N 个神经元N 个权重N 个偏置 等等。这些 N 个 xx 不是凭空产生的,而是需要进行大规模的训练后,确定最优的 N 个 xx

待【神经网络】内部数据确定完成后,即【AI 大模型】训练完成。成品就是拥有N 个 xx神经网络

神经网络 不在接受权重、偏置等参数的变化,转而用于计算、推演。

后续使用【AI 大模型】,即使用【神经网络】的推演。

训练阶段

通过海量的数据,无数次的执行【神经网络】,以确定最优的神经元、权重、偏置等数据,达到:

  1. 后续提供一个输入,如猫、纸张。
  2. 经过【神经网络】计算后输出结果为:猫 0.98,纸张 0.99,人 0.003。
  3. 多次使用不同的输入,最终输出都达到预期,即模型训练完成。

神经元

神经元是一个函数,或者称为特征。

把一段文本、一张图片用向量表示,需要 10 维甚至更高维度,如:aaaaaab = [0.86, 1.0, 0.0, 0.0, 1.0, 1.0, 1.0, 0.0] 。这里的每一个数值,都表示一个特征,如:是否有 a 字符?是否有 c 字符?

在模型训练阶段,对于海量的训练数据,模型需要自行发觉原始数据的各种特征,并将特征通过海量的神经元来进行表达。最终的效果可能是:

输入层:将原始数据向量化,生成【词汇表(向量和原始数据之间的纽带)】