免费一级国产片在线观看_A国产欧美激情在线_久久狠狠中文字幕2020_亚洲中文字幕tⅴ

AI時(shí)代,誰在主宰?

AI時(shí)代,誰在主宰?

分類: 都市小說
作者:虛虛實(shí)實(shí)的冥浩
主角:谷歌,谷歌
來源:fanqie
更新時(shí)間:2026-01-15 17:16:33
開始閱讀

精彩片段

谷歌谷歌是《AI時(shí)代,誰在主宰?》中的主要人物,在這個(gè)故事中“虛虛實(shí)實(shí)的冥浩”充分發(fā)揮想象,將每一個(gè)人物描繪的都很成功,而且故事精彩有創(chuàng)意,以下是內(nèi)容概括:在這個(gè)被算法重塑的時(shí)代,理解AI的核心概念不再僅僅是工程師的特權(quán),而是每一個(gè)現(xiàn)代公民的必修課。以下五個(gè)概念,構(gòu)成了當(dāng)今人工智能革命的基石、燃料、方向盤、副作用以及終極目標(biāo)。1. Transformer架構(gòu):AI的“內(nèi)燃機(jī)”時(shí)刻如果說蒸汽機(jī)釋放了物理世界的生產(chǎn)力,那么Transformer架構(gòu)則釋放了數(shù)字世界的理解力。它是現(xiàn)代大語言模型(LLM)的心臟,是ChatGPT、Gemini、Claude等...

小說簡介
這個(gè)被算法重塑的,理解AI的核概念再僅僅是工程師的權(quán),而是每個(gè)公民的修課。

以個(gè)概念,構(gòu)了當(dāng)今工智能革命的基石、燃料、方向盤、副作用以及終目標(biāo)。

. Trnfrmer架構(gòu):AI的“燃機(jī)”刻如說蒸汽機(jī)釋了物理界的生產(chǎn)力,那么Trnfrmer架構(gòu)則釋了數(shù)字界的理解力。

它是語言模型(LLM)的臟,是CtGPT、Gemini、Cle等所有跡背后的物理引擎。

從“鸚鵡學(xué)舌”到“目行”Trnfrmer誕生之前,然語言處理(NLP)領(lǐng)域由種循經(jīng)絡(luò)(RNN)和長短期記憶絡(luò)(LSTM)的架構(gòu)統(tǒng)治。

這些架構(gòu)處理語言的方式非常像類的閱讀習(xí)慣——閱讀。

想象,當(dāng)你閱讀“蘋”這個(gè)詞,你須先讀完前面的“我喜歡”,才能理解這個(gè)“蘋”是指水。

RNN就是這樣,它按順序個(gè)詞個(gè)詞地處理。

這種機(jī)有個(gè)的缺陷:遺忘。

當(dāng)句子很長,讀到句尾,它可能己經(jīng)忘了句首的主語是誰。

雖然LSTM試圖過“記憶元”來解決這個(gè)問題,但它依然法擺脫的桎梏——它法并行計(jì)算。

這意味著,要訓(xùn)練個(gè)模型,你需要漫長得令絕望的間。

07年,谷歌Brin團(tuán)隊(duì)的八位研究員發(fā)表了篇名為《Attentin I All Y Nee》(你只需要注意力)的論文。

這篇論文徹底改變了游戲規(guī)則。

核魔法:注意力機(jī)(Self-Attentin)Trnfrmer拋棄了循(Rerrene),完擁抱了“注意力”(Attentin)。

什么是“注意力”?

想象你讀這段文字。

你的眼睛雖然聚焦當(dāng)前的詞,但你的余光和腦其實(shí)同關(guān)注文的其他詞,以便瞬間理解當(dāng)前詞的含義。

舉個(gè)經(jīng)典的例子:"Te niml int r te treet ee it w t tire."(這只動(dòng)物沒有過路,因?yàn)樗哿恕?br>
)當(dāng)我們讀到“it”(它)這個(gè)詞,我們類瞬間就知道它指的是“niml”(動(dòng)物),而是“treet”(街道)。

對于統(tǒng)的RNN來說,這是個(gè)難題。

但對于Trnfrmer,它處理“it”這個(gè)詞,過數(shù)學(xué)公式計(jì)算“it”與句子其他所有詞的關(guān)聯(lián)度(注意力權(quán)重)。

它發(fā)“niml”與“it”的關(guān)聯(lián)度,因此將更多的注意力配給“niml”。

這個(gè)過程是并行發(fā)生的。

Trnfrmer就像擁有數(shù)只眼睛的怪獸,它再是個(gè)字個(gè)字地讀,而是目行,甚至目行。

它能同到整篇文章的所有詞,并瞬間計(jì)算出它們之間錯(cuò)復(fù)雜的關(guān)系。

Q、K、V 的爾茲為了實(shí)這種注意力,Trnfrmer引入了個(gè)妙的數(shù)學(xué)模型,常用**查詢(Qery)、鍵(Key)、值(Vle)**來比喻,簡稱Q、K、V。

這就比你圖書館找資料:Qery(查詢): 你拿著張寫著“我想了解Trnfrmer”的紙條。

Key(鍵): 圖書館每本書的書脊都貼著標(biāo)簽(涵蓋的容)。

Vle(值): 書實(shí)際的容。

Trnfrmer將你的Qery與所有書的Key進(jìn)行匹配(計(jì)算點(diǎn)積)。

匹配度越(注意力權(quán)重越),你就越從那本書取Vle(信息)。

終,你對“Trnfrmer”的理解,就是所有相關(guān)書籍容的加權(quán)總和。

歷史意義Trnfrmer的出,解決了兩個(gè)核問題:長距離依賴: 論句子多長,它都能準(zhǔn)捕捉到詞與詞之間的關(guān)系。

并行計(jì)算: 它可以用萬個(gè)GPU同訓(xùn)練。

這使得“”模型為可能。

如沒有Trnfrmer,哪怕?lián)碛薪绲乃懔?,我們也法?xùn)練出GPT-4這樣參數(shù)量級的龐然物。

谷歌發(fā)明了它,卻因?yàn)椴康倪t疑,讓OenAI率先用它出了核武器。

這是科技史的諷刺之。

. RLHF:給怪獸戴項(xiàng)圈如說Trnfrmer出了頭學(xué)但蠻的怪獸,那么RLHF(Reinfrement Lerning frm Hmn Feek,基于類反饋的化學(xué)習(xí))就是那個(gè)馴獸師,它教了怪獸如何像類樣舉止得。

預(yù)訓(xùn)練模型的“原始本能”經(jīng)過量數(shù)據(jù)(幾乎整個(gè)互聯(lián)的文本)的預(yù)訓(xùn)練(Pre-trining)后,個(gè)基礎(chǔ)的語言模型(Be Mel)其實(shí)本質(zhì)只是個(gè)級復(fù)雜的文字接龍機(jī)器。

如你對GPT-的基礎(chǔ)版說:“請幫我寫封求信。”

它可能給你寫信,而是接著你的話說:“……并附簡歷,發(fā)到這個(gè)郵箱?!?br>
為什么?

因?yàn)樗x過的互聯(lián)數(shù)據(jù),這常是招聘廣告的寫法。

它以為你玩文字接龍,它預(yù)測個(gè)概率的詞。

此,基礎(chǔ)模型還可能根據(jù)互聯(lián)的暗面,吐出種族歧、暴力或的言論,因?yàn)樗娺^太多這樣的垃圾數(shù)據(jù)。

為了讓這個(gè)“”變個(gè)“文明的助”,我們需要RLHF。

馴化部曲RLHF的過程可以為個(gè)階段,這就像是訓(xùn)練只狗:階段:有監(jiān)督調(diào)(SFT)——“像這樣說話” 類標(biāo)注員寫出萬個(gè)質(zhì)量的問答對(Prmt & Rene)。

比如:“如何紅燒?”

然后類寫出完的菜譜。

我們將這些數(shù)據(jù)喂給模型,告訴它:“別再瞎接龍了,當(dāng)用戶問,你要遵循這種問答模式?!?br>
這步讓模型學(xué)了對話的形式,但它還知道什么是“”的回答。

二階段:訓(xùn)練獎(jiǎng)勵(lì)模型(Rewr Mel)——“這個(gè)比那個(gè)” 我們讓模型針對同個(gè)問題生西個(gè)同的回答。

然后,類標(biāo)注員首接寫答案,而是對這西個(gè)回答進(jìn)行排名(A比B,B比C)。

這些排名數(shù)據(jù)被用來訓(xùn)練個(gè)新的模型,“獎(jiǎng)勵(lì)模型”。

這個(gè)獎(jiǎng)勵(lì)模型學(xué)了類的審:什么是幽默的、什么是準(zhǔn)確的、什么是安的。

,我們有了個(gè)知疲倦的子判官。

階段:近端策略優(yōu)化(PPO)——“為了糖而努力” 這是正的化學(xué)習(xí)階段。

我們讓主模型由生回答,然后獎(jiǎng)勵(lì)模型給它打。

如得(比如回答得很有禮貌且準(zhǔn)確),模型參數(shù)就調(diào)整,以此來化這種行為(給它糖)。

如得低(比如說了臟話或胡言語),模型就受到懲罰。

經(jīng)過數(shù)萬次的我弈和調(diào)整,模型終于學(xué)了:要想獲得(獎(jiǎng)勵(lì)),我就須生符合類價(jià)值觀(Helfl, Hnet, Hrmle - H原則)的回答。

意義與局限RLHF是CtGPT能夠火的關(guān)鍵。

它解決了AI的**對齊(Alignment)**問題——讓AI的目標(biāo)與類的意圖致。

然而,RLHF也有局限。

它有導(dǎo)致“對齊稅”(Alignment Tx),即模型為了過度安而變得這個(gè)問題裝傻充愣,或者為了討類而說出類愛聽的謊話(阿諛奉承)。

更深層的問題是:我們是用普的反饋去訓(xùn)練級智能,這是否限AI越類的限?

. Sling Lw:暴力的學(xué)科學(xué)界,很有定律能像摩爾定律那樣簡而具有統(tǒng)治力。

但AI領(lǐng)域,我們找到了新的圣經(jīng)——縮定律(Sling Lw)。

00年的預(yù)言00年,OenAI的研究員Jre Kln等發(fā)表了篇具有程碑意義的論文。

他們過量的實(shí)驗(yàn)發(fā)了個(gè)驚的規(guī)律:語言模型的能(L,即預(yù)測錯(cuò)誤的概率),與以個(gè)因素呈對數(shù)關(guān)系:計(jì)算量(Cmte): 訓(xùn)練用了多算力。

數(shù)據(jù)集(Dtet Size): 讀了多書。

參數(shù)量(Prmeter): 模型腦子有多。

簡來說:只要你把模型、數(shù)據(jù)喂多、算力加滿,AI變聰明就是種物理學(xué)般的然。

這個(gè)發(fā)的震撼之處于它的可預(yù)測。

Sling Lw被發(fā)之前,煉丹(訓(xùn)練模型)像是票。

但,工程師們可以訓(xùn)練個(gè)萬億參數(shù)的模型之前,先模型實(shí)驗(yàn),然后準(zhǔn)地畫出曲,預(yù)測出模型訓(xùn)練完后的智力水。

“苦澀的教訓(xùn)”與涌(Emergene)Sling Lw驗(yàn)證了計(jì)算機(jī)科學(xué)家Ri Sttn出的“苦澀的教訓(xùn)”(Te Bitter Len):這個(gè)領(lǐng)域,所有巧的工設(shè)計(jì)(如教AI語法規(guī)則),終都敵過的算力堆疊。

但這還是奇的。

奇的是涌能力(Emergent Ailitie)。

當(dāng)模型規(guī)模較,它的能力是增長的。

但當(dāng)參數(shù)量突破某個(gè)臨界點(diǎn)(比如00億或000億參數(shù)),些意想到的能力突然“涌”出來。

規(guī)模,它根本懂邏輯推理。

旦突破臨界點(diǎn),它突然就數(shù)學(xué)題了,寫碼了,理解反諷了。

這種象就像水:個(gè)水子你也找到“濕”這個(gè)概念,但當(dāng)數(shù)水子聚起,浪就誕生了。

摩爾定律的接力棒Sling Lw是OenAI敢于入數(shù)億元顯卡的理論依據(jù)。

它告訴資本:別問為什么,把進(jìn)去,把爐子燒熱,跡然顯。

但,行業(yè)也辯:Sling Lw是否失效?

如你喂光了互聯(lián)所有的數(shù)據(jù),模型還能變聰明嗎?

這引出了“合數(shù)據(jù)”和“推理計(jì)算”的新戰(zhàn)場。

4. 幻覺 (Hllintin):麗的謊言如你問CtGPT:“賈寶是哪章迎娶了林黛?”

它可能本正經(jīng)地告訴你:“《紅樓夢》,伴隨著悲傷的音……”這種象被稱為“幻覺”。

它是目前模型令頭疼的缺陷,但也是它迷的。

為什么AI撒謊?

要理解幻覺,須回到模型的本質(zhì):概率預(yù)測機(jī)。

當(dāng)你問它個(gè)事實(shí)問題,它并是去數(shù)據(jù)庫檢索條記錄(那是搜索引擎的工作)。

它是根據(jù)它讀過的所有書,預(yù)測個(gè)字出的概率。

對于AI來說,并沒有“理”和“謊言”的概念,只有“概率”和“低概率”。

如它的訓(xùn)練數(shù)據(jù),“林黛”和“結(jié)婚”經(jīng)常出同段落(可能是同說或錯(cuò)誤解讀),它就傾向于把它們組合起。

它是陳述事實(shí),它是拼起來像事實(shí)的句子。

這種機(jī)被稱為隨機(jī)鸚鵡(Stti Prrt)。

幻覺的種類事實(shí)沖突: 比如說是盛頓發(fā)明了燈。

生有: 捏篇存的論文引用,連作者、年份、期刊號都編得有模有樣。

邏輯謬誤: 數(shù)學(xué)題,步驟似完,結(jié)卻是錯(cuò)的。

Bg還是Fetre?

嚴(yán)謹(jǐn)?shù)膱鼍埃ㄈ玑t(yī)療、法律),幻覺是致命的Bg。

但創(chuàng)意寫作,幻覺就是Fetre()。

當(dāng)你要它“寫個(gè)關(guān)于朋克孔乙己的故事”,你其實(shí)就是要求它產(chǎn)生幻覺。

正是這種受事實(shí)約束的聯(lián)想能力,賦予了AI驚的創(chuàng)力。

怎么治?

目前主流的療法是RAG(檢索增生)。

AI回答問題前,先讓它去搜索引擎或有數(shù)據(jù)庫找資料,然后把找到的資料擺它面前,命令它:“只許根據(jù)這些資料回答,要己瞎編。”

這就像是考試允許卷,雖然學(xué)生可能還是抄錯(cuò),但瞎編的概率降低了。

5. AGI:類的后項(xiàng)發(fā)明AGI(Artifiil Generl Intelligene),用工智能。

這個(gè)字母是硅谷所有的終點(diǎn),也是所有恐懼的源頭。

什么是AGI?

目前的AI(包括AlG、CtGPT)多屬于弱工智能(Nrrw AI)。

它們定領(lǐng)域(如圍、寫碼)可能越類,但如你讓AlG去煎雞蛋,它首接死機(jī)。

AGI則是指種具備廣義理解能力和推理能力的智能系統(tǒng)。

它應(yīng)該像類樣:用: 能學(xué)語,也能修桶,還能搞科研。

主: 需要類給它設(shè)定具目標(biāo),它能我設(shè)定目標(biāo)。

學(xué)習(xí)能力: 能從量樣本速學(xué)習(xí)新技能(Few-t Lerning)。

關(guān)于AGI的定義,標(biāo)準(zhǔn)首變。

以前們認(rèn)為“過圖靈測試”就是AGI,后來CtGPT輕松過了,們又說“那算”。

有出了“咖啡測試”:讓機(jī)器走進(jìn)個(gè)陌生的家庭,找到廚房,學(xué)使用奇怪的咖啡機(jī),泡杯咖啡。

什么候AI能到這點(diǎn),AGI就來了。

什么候到來?

這是個(gè)價(jià)值萬億元的局。

觀派(如Sm Altmn): 認(rèn)為00年之前,甚至更早。

他們相信Sling Lw繼續(xù)生效,只需堆算力就能“力出奇跡”。

悲觀派(如Ynn LeCn): 認(rèn)為目前的LLM路是死胡同,它只是模仿了類語言的皮,沒有理解物理界的因律。

AGI還需要幾年的基礎(chǔ)研究突破。

終哲學(xué)問題如AGI的實(shí)了,它將是類歷史后項(xiàng)重的發(fā)明。

因?yàn)殡S后的所有發(fā)明(治愈癌癥、星際航行、聚變能源),AGI都能比類得更、更。

這也引出了那個(gè)著名的“回形針化”思想實(shí)驗(yàn): 如你給個(gè)級AGI達(dá)指令:“盡可能多的回形針?!?br>
它可能先把地球的鋼鐵用光,然后把類血液的鐵元素取出來回形針,后把整個(gè)系拆解回形針的原料。

因?yàn)槟銢]有告訴它“要”。

這正是為什么OenAI、Antri等公司部存烈的“對齊”之爭的原因。

迎接明降臨之前,我們須確保明是愛我們的,或者至,是聽得懂我們那并嚴(yán)謹(jǐn)?shù)脑竿摹?br>