大腦的逆向工程:任務概況

將人類智能與計算機在速度、精度、存儲分享能力上所固有的優越性結合起來是十分艱巨的。然而,到目前為止,大多數人工智能的研究和發展已經利用了一些工程方法,但是這些方法不一定基於人腦功能,原因很簡單,我們還沒有精密的工具去開發詳細的人類認知模型。

我們大腦逆向工程的能力——觀察內部、建模並模擬各區域——正以指數方式增長。我們最終會理解隱藏在思維、知識全部範圍內的運作原則,這些將為開發智能機器的軟件提供強大的程序支持。伴隨著這些計算技術的應用,它們將得到不斷修改、完善和擴展,而這些技術遠比生物神經元內部的電化學加工過程更為強大。這一宏偉工程的關鍵優勢是,它為我們提供了精確的見解。我們也將獲得有效的新方法,以便治療諸如阿爾茨海默氏症、帕金森氏症、感官殘疾、中風等疾病,並最終大大擴展我們的智能。

新的腦成像和建模工具。通過逆向工程仔細研究大腦的第一步是確定它的工作原理。到目前為止,我們的工具,雖然很簡陋,但也正在發生變化,作為新的掃瞄技術,它大大改善了時間和空間分辨率,提高了性價比和帶寬。同時,我們正在迅速地積累關於大腦系統及其組成部分的精確特點和動態性的數據,這些數據包括從個別突觸到大的區域,如小腦,其中包括超過一半的大腦神經元。大量的數據庫正在有條不紊地為我們呈指數增長的大腦知識組織目錄。3

研究人員已經證明,他們能迅速地理解和應用這些通過建模仿真出來的信息。大腦區域模擬的基礎是數學複雜性理論和混沌計算原理,並且已經獲得了與實際人類和動物大腦緊密匹配的實驗結果。

正如在第2章所說,大腦逆向工程所需的掃瞄和計算工具的能力正在加速提高,這可以加速提升基因組計劃可行技術。當我們到達納米機器人時代,我們將能夠利用高時空分辨率,從大腦內部進行掃瞄。4我們有能力逆向設計人類智慧的運作原則,並可以在更強大的基板上複製這些能力,要做到這些並不存在內在的障礙,我們將會在幾十年後實現它們。人類的大腦是一個具有複雜等級制度的系統,但並不代表它的複雜程度已經超出我們可以處理的範圍。

大腦軟件。計算和通信的性價比每年翻一番。正如我們前面看到的,模擬人類智能的計算能力可在不到20年內實現。5一個隱藏在奇點期望下的重要設想是非生物媒介能夠模擬大腦思維的豐富度、精度和深度。但是實現一個單一人類大腦的硬件計算能力(甚至是一個村莊和國家的集體智力)將不會自動產生人類水平的能力。(我說的「人類水平」包括所有使人類智能化的多樣而微妙的方式,如音樂和藝術才能、創造力、穿越世界的物理運動、理解和適度的回應情緒。)硬件的計算能力是必要的,但還不夠。理解這些資源(智能軟件)的組織和內容更為關鍵,這是大腦逆向工程所承諾的目標。

一旦計算機達到人類的智能水平,它一定會飆升上去。非生物智能的一個關鍵優勢在於機器能夠輕鬆共享它們的知識。如果你學法語或閱讀《戰爭與和平》,你不能輕易地通過下載來完成,就像學習對於我來說,我要獲得學問也要付出和你一樣艱苦的努力。我不能(也還沒有)快速訪問或傳輸你的知識,因為知識是根植於神經遞質濃聚物(允許一個神經元影響另一個的突觸的化學物質的水平)的一種巨大模式以及神經元間的連接(這稱為是連接神經元的軸突和樹突,是神經元的一部分)中。

但需要考慮到機器智能的各個方面。在我的一家公司裡,我們花了數年的時間使用模式識別軟件教一個研究性計算機識別人類的連續講話。6我們向它展示了數千小時的錄音講話,糾正了它的錯誤,並耐心地訓練它的「混沌」自組織算法來改善性能(這是一種修改自己規則的方法,它基於半隨機初始信息的過程,其結果不能完全預測)。最後,電腦變得非常善於識別講話。現在,如果希望個人計算機識別講話,你不必通過同樣艱苦的學習過程(就像我們對待每個人的孩子一樣),僅通過幾秒鐘的下載就可以建立這一模式。

分析大腦VS神經形態模型。為了瞭解人類智能和當代人工智能之間的分歧,我們可以通過一個很好的例子來說明,這就是它們各自是如何解決國際象棋問題的。人類是通過認知模式,而機器則是建立龐大的邏輯「樹」,裡面包含所有可能的位置移動和對策。迄今為止的大多數技術都是利用後一種的「自上而下」的分析設計方法。例如我們的飛行器不能試圖重建鳥類的生理機能和生物結構。作為逆向設計自然方式的工具正在複雜性上迅速發展,技術正在走向模擬自然的道路,而這些技術也將在更強大的基板上實施。

掌握智能軟件最吸引人的場景就是直接進入到一個藍圖,也就是智能進程中我們親手實現的最好樣例:人的大腦。雖然原來的「設計師」(進化)用了幾十億年時間來發展大腦,但我們還是很容易就能獲得它。雖然大腦被頭蓋骨保護著,但我們還是可以使用合適的工具將它暴露在我們的視野範圍內。大腦的內容還沒有版權或專利。(不過,我們可以期待著改變,基於大腦逆向工程的專利已經有人申請。)7我們將利用數千萬億來源於大腦掃瞄和各級別神經模型的信息,來為我們的機器設計更多智能的並行算法,特別是那些基於自組織模式的算法。

採用這種自組織的方法,我們不必試圖複製每一個神經元連接。在任何特定大腦區域都有大量的重複和冗余。我們發現,較高級的大腦區域模型比較詳細的神經元組成部分的模型還比較簡單。

大腦有多麼複雜?雖然在人類大腦中的信息需要10億比特按順序存放(見第3章),大腦的最初設計還是基於相當緊湊的人類基因組的。整個基因組由8億字節組成,但大部分是多餘的,只留下約3000萬~1億字節(小於109比特)的獨特信息(壓縮後),這比微軟的Word程序還要小。8公平地說,我們也應考慮到「後生」的數據,也就是那些存儲在控制基因表現(也就是確定允許哪些基因在每個細胞中創建蛋白質)的蛋白質中的信息,以及整個蛋白質的複製機制,如核糖體和眾多酶。然而,這些額外的信息並沒有較大地改變這種計算的數量級。9遺傳基因中略多於一半的信息和後生的信息塑造了人類大腦的初始狀態。

當然,當我們與世界交互時,我們的大腦複雜性大大增加了(大約是基因組的10億倍)。10但是,在每個特定的大腦區域中可以發現很多高度重複的模式,所以沒有必要捕捉每個細節,以便逆向設計數字和模擬相結合的有關算法(例如,神經放電可以認為是一個數字事件,然而在突觸的神經遞質水平上則可以視為是模擬值)。例如,小腦的基本的布線圖在染色體中只描繪過一次,但卻要重複數十億次。通過分析來自大腦掃瞄和建模的信息,我們可以設計模擬「神經形態」的等價軟件(算法的功能相當於一個大腦區域的整體性能)。

只有在大腦掃瞄和神經元結構信息可用後,可行模型和模擬仿真的創建才可以進行。超過50000名神經科學家為超過300個期刊撰寫過這方面的文章。11該領域廣泛而且多樣化,科學家和工程師創造新的掃瞄和遙感技術,多層次地發展模型和理論。所以,即使是這個領域的人們,往往也都沒有完全意識到當代研究的整體規模。

為大腦建模。在當代神經系統科學中,建模和模擬仿真正在由多種來源開發出來,包括大腦掃瞄、神經元間的連接模型、神經元模型和心理生理測試。如前面所述,聽覺系統研究者勞埃德·瓦特製作了一個聽覺處理系統重要部分的綜合模型,它來源於特定神經類型和神經元間連接信息的神經生物學研究。瓦特的模型包括5個平行的路徑和神經傳導每個處理階段的聽覺信息的實際表現形式。瓦特用計算機實驗了他的模型,他將這個模型作為一個實時軟件,可以用來定位和識別聲音,這類似於人類聽力的方式。雖然該項工作還正在進行,但已經可以看到,該模型闡明了對神經生物學的工作模式和腦連接數據進行模擬仿真的可行性。

正如漢斯·莫拉維茨等人的推測,這些高效率的功能模擬所需要的計算量大約比我們模擬每個樹突、突觸以及該區域的其他副神經結構的非線性要少1000倍。(正如我在第3章討論的,大腦仿真估計需要每秒1016次計算,與此相對應的副神經非線性的仿真則需要1019cps。)12

現代電子和生物神經元連接間的電化學信號的實際速度比至少有1000 000:1。我們在生物學的各個方面都能發現相同的低效率,因為生物進化建立的所有機制和系統都是使用嚴格約束的材料:細胞,它本身是由有限的蛋白質集合組成。雖然生物蛋白質是三維的,但是它們也僅限於從線性(一維)的氨基酸序列折疊成複雜分子。

剝洋蔥。大腦不是一個單一的信息處理機構,而是一個複雜的集合,由數百個專門區域交織在一起。理解這些交叉區域功能的「剝洋蔥」過程正在順利地進行當中。當必要的神經元描述和大腦神經元間的連接的數據可利用時,詳細的、可實施的副本,例如接下來要描述的聽覺區域模擬將在大腦各區域發展。

大多數大腦建模算法都是不連續的邏輯算法,這也是當前常見的數字計算方法。大腦的工作過程往往是自組織、混亂且全息的(即不在一個地方但分佈在整個區域的信息)。這也是大規模並行的,而且使用混合數字控制的模擬技術。然而,大範圍的項目表明,我們能夠理解這些技術,並能夠從我們大腦及其組織裡迅速升級的知識中抽像出來。

在理解了某一特定區域的算法後,它們就可以在合成神經當量之前加以完善和延伸。它們可以運行在一個遠遠快過神經線路的計算基板上(當前計算機的計算在十億分之一秒級別,而神經元間的傳導是千分之幾秒)。此外,我們還可以利用已經瞭解的建造智能機器的方法。

《奇點臨近》