大多數人的意見就是正確的?美科學家開發出糾錯新算法
2017-02-10 09:46:36   來源:科學網
內容摘要
群眾智慧不靠譜怎么辦?美國科學家開發出糾錯新算法,這種新算法更有效地找出正確答案的比例高出了21%至36%。它更加善于回答“是”與“非”的問題。

? ? 正確的答案并非總是最受歡迎的那一個。大多數人的意見也有不正確的時候,美國麻省理工學院的科學家就根據這一現象開發出一種新的糾錯算法。

? ? 但在有些情況下,這一經典理論將面臨著分崩離析的危險。如果你問一群人,費城是不是美國賓夕法尼亞州的首府,大多數人都會錯誤地回答“是”。這是因為他們知道這樣一組事實——費城是賓夕法尼亞州的一座大型城市,而省會城市往往是巨大的。但另一群更少的人會給出正確的答案:哈里斯堡。

? ? 由劍橋市麻省理工學院社會科學家Drazen Prelec率領的一個研究小組在日前出版的《自然》雜志上報告稱,一種新的算法可以幫助正確的答案從人群中脫穎而出,即便最流行的答案是錯誤的也沒有關系。

? ? 在這項研究中,科學家要求試驗受試者回答一組給定的問題。隨后研究人員要求這些受試者猜測其他人會怎樣回答這些問題。新的算法之后便會尋找那些“出人意料流行”的答案,抑或是比大多數受試者所認為的更加流行的答案。在大多數情況下,超出預期的答案往往是正確的。

大多數人的意見就是正確的?美科學家開發出糾錯新算法 科技世界網

? ??

? ? Prelec表示:“在社會中,我認為有這樣一個假設,即平均意見一般是正確的,這是受到過去對群眾智慧的統計參數所支持的。”他說:“但這不是證據應有的工作方式。這里有具備專門知識的專家,比如醫生。這讓我們了解了這些知識。”

? ? Prelec和他的同事向由20名到51名受試者組成的不同小組詢問了各種各樣的問題。這些問題有時是簡單的地理知識,例如省會城市的名稱;有時則要求受試者評估藝術的價值,以及要求皮膚科醫生診斷皮膚損害。

? ? Prelec說,大多數情況下,與其他方法(例如依靠最流行的答案或者根據信心給答案排名)相比,這種新算法更有效地找出正確答案的比例高出了21%至36%。它更加善于回答“是”與“非”的問題,例如費城是哪里的首府,而不是評估藝術的價值。

? ? 加利福尼亞大學爾灣分校認知科學家Mark Steyvers指出:“這是一項非常聰明的技術,也是對投票的人來說非常簡單的一種方式。”

? ? Steyvers指出,在現實生活中,人們互相詢問彼此的背景和能力,從而用來確定其信息的有效性。他說,但是在匿名投票的情況下,Prelec的方法是依據專業知識來確定觀點的好方法。

? ? 然而Prelec和Steyvers都警告稱,這一算法并不能解決生活中遇到的所有難題。它只適用于真實的話題,即人們不得不以老式的方式找出政治和哲學問題的答案。?


科學家首次打造出可“自檢查、自糾錯”的量子電路

? ? 要實現量子計算的夢想,就必須先克服一些困難,比如保持存儲系統的穩定——即克服量子計算信息的基本單元(量子位/qubit)所固有的不穩定性。好消息是,來自美國加州大學伯克利分校的物理學家們,已經打造出了一個突破性的電路,它能夠不斷地自我檢查、以保持量子存儲始終處于無差錯的狀態。

? ? 量子信息很容易遇到由環境所引發的錯誤,比如宇宙射線、或者一個位置的量子相干(quantum coherence)崩潰,這意味著包含一個量子位的信息很容易丟失。

? ? 此外,由于量子糾纏態的特殊性,任何試圖復制信息的行為,都會對它造成即時的破壞。

? ? 不過,身為一名研究生的UC Berkeley約翰·馬蒂尼物理實驗室研究員Julian Kelly表示:“量子計算的一個最大挑戰,就是量子比特本身出現了問題(inherently faulty)。所以如果你在里面存儲了一些信息,它們是會被忘記的”。

? ? 該團隊并未嘗試維持一個量子比特(比方說將其誘捕到硅的同位素中),而是通過某種基于算法的方式來實現。

? ? 不同于傳統計算機,量子計算機不使用二進制(0和1)來存儲數據,因為它還擁有另一種“疊加態”(superpositioning),即它既可以是0、也可以是1。

? ? 尷尬的是,盡管這一特性讓它在計算能力方面擁有顯著優點,但量子位也有一個顯著的缺點,那就是量子位很容易出現“翻轉”(flipping,狀態隨機地改變),而且在不穩定的環境中會更加嚴重。

大多數人的意見就是正確的?美科學家開發出糾錯新算法 科技世界網

? ??

? ? Kelly說到:“這使得我們很難處理信息,如果它消失了的話”。為了解決這個問題,他們想出了全新的錯誤檢測和校正方法——將信息同時存儲在多個量子位上。

? ? 該團隊的想法是:“我們打造了一套包含9個量子比特、然后可以查找錯誤的系統。網格中的量子位負責維護其鄰位信息(通過重復的誤差檢測和校正),如此一來,相應的信息就可以保存得比任何單獨的量子位都更長久更準確”。

? ? 這么做的必要之處在于,量子態存在于量子比特之中:你可以知道一個粒子的位置,也可以衡量它的動量(momentum),但卻不能同時使用。

? ? 該校博士后研究員Rami Rarends稱:“你不能衡量一個量子態,不能給期望它仍然是個量子。測量的行為會將量子比特鎖定到一種單一的狀態,而它也失去了成為疊加態的能力”。

? ? 為了做到這點,該校科學家兼工作人員Austin Fowler使用了所謂的“表面代碼”(Surface code),以提供有關錯誤的信息。

? ? 通過反復測量矩陣中每個量子位與其相鄰數據的相互作用,測量值的變化就暗示了空間和時間上出現了錯誤。

簡而言之,該代碼借用了“奇偶校驗值”(parity information)來檢測原始數據的任何變化。

? ? 在這種狀態下,如果偏振狀態被施加到了一組量子位上,那么這些量子位就會被傳送到系統中的其它地方,而任何極化變化都可以通過原始狀態和傳輸過來的量子狀態的比對而得知。

? ? 最終,我們可以拉出足夠的信息來檢測錯誤,但又不會因為“偷窺”而破壞底層的量子態。

? ? 截至目前,該團隊的研究已經證明了可將一個量子位的“翻轉”錯誤給否定掉。不過他們希望下一步能夠解決其它量子位“退相干”(decoherence)問題,比如對“相位翻轉”錯誤進行“互補”。

? ? Martinis團隊的高級研究人員們現在也有與Google進行合作,以便進一步探索該技術和研究量子計算的應用。相關論文已經發表在《自然》(Nature)雜志上。


幾分鐘“搞定”蛋白質分子3D結構 機器學習新算法加速藥物研發進程

? ? 加拿大多倫多大學的科研人員最新研制出了一套新的機器學習算法,能生成微小蛋白質分子的3D結構。研究人員指出,新算法有望徹底變革藥物的研發進程以及我們對生命的理解。

  研發人員之一、多倫多大學的博士生阿里·普勒賈尼解釋稱,確定蛋白質分子的3D原子結構對于理解它們的工作原理及其對藥物治療產生何種反應至關重要。

  藥物會附著到特定蛋白質分子上,改變其3D形狀及工作方式。理想的藥物一般被設計成某種特定形狀,使其僅附著到某個特定的蛋白質或與疾病相關的蛋白質上,而且在其附著到體內其他蛋白質上時不會出現副作用。

大多數人的意見就是正確的?美科學家開發出糾錯新算法 科技世界網

  

? ? 鑒于蛋白質比光波波長還小,如果不使用復雜技術,如冷凍電子顯微鏡(Cryo-EM)技術,無法直接看見它們。Cryo-EM技術使用高能顯微鏡,從不同方位將冷凍蛋白質的樣本拍攝出成千上萬張低清晰度圖像,但用這些低清晰度2D圖像拼接出正確的高清3D結構非常困難。

  而新算法使用顯微圖像重建了蛋白質分子的3D結構,提供了一種更快速、有效地獲得正確蛋白質結構的方式。研究人員稱,現有技術需要花費數天甚至數周,借助多臺計算機才能生成一個3D結構,而新方法借助單臺計算機幾分鐘就能搞定,有望極大地推動新藥研發。

  多倫多大學計算和數學科學學院院長戴維·弗利特解釋說:“新方法主要解決了獲得3D結構的速度和數量方面的問題。”

  普勒賈尼表示:“我們希望這一方法能大大加快新藥研發進程,并讓我們能從原子層面加深對生命的理解。”


Facebook田淵棟:德州撲克上戰勝人類的AI究竟用的是什么算法?

? ? 最近聽說我的母校卡耐基梅隆大學德州撲克的AI Libratus以很大的優勢贏得了與職業玩家的比賽,非常興奮。在同時期,還有一篇來自加拿大阿爾伯塔大學(Univ of Alberta)的文章介紹了DeepStack,同樣在3000局的比賽中擊敗了幾位職業玩家。這樣在非對稱信息游戲上人類再一次輸給了AI。

? ? 當然有AlphaGo的先例,這個對廣大吃瓜群眾的沖擊可能沒有那么大。但我個人覺得非對稱信息博弈的實用價值更大些。因為非對稱信息博弈的應用范圍非常廣泛,涵括我們每天遇到的所有決策,上至國家戰略,下至日常瑣事,全都可以以同樣的方法建模。

? ? 非對稱信息博弈難在哪里?

? ? 一方面是因為對于同樣的客觀狀態,各個玩家看到的信息不同,因此增加了每個玩家狀態空間的數目和決策的難度;

? ? 另一方面即使在同樣的狀態數下,解非對稱信息游戲所需要的內存也要比解對稱信息要多得多,這個主要是對于對稱信息博弈來說,只要記得當前局面并且向下推演找到比較好的策略就可以了;但對非對稱信息博弈,只記得當前(不完整的)局面是不夠的,即使盤面上的情況相同,但對手之前的各種招法會導致事實上局面不同,只有把它們全都羅列出來進行分析,才能保證想出的應對策略不被別人利用。

? ? 比如說玩石頭剪刀布,在看不到別人出招的時候輪到自己出招,如果別人一直用石頭剪刀布各1/3的混合策略,那自己就會發現好像怎么出招收益都是0,于是每次都出石頭,但是這樣的話,對手就可以利用這個策略的弱點提高自己的收益。所以一個好的算法就要求,基于別人已有策略得到的新策略盡可能地少被別人利用(low exploitability)。

? ? 這次的游戲是Head-up unlimited Texas Hold'em,直譯過來是兩人無限注德州撲克。所謂兩人就是一對一的零和游戲,不是多人游戲。所謂無限注,就是在加籌碼的時候可以任意加(比如著名的把全部籌碼都押上的All in),而限注(limited),是指在加籌碼的時候只能加一個固定的數字(通常是前兩輪和大盲注一樣,后兩輪是大盲注兩倍)。

大多數人的意見就是正確的?美科學家開發出糾錯新算法 科技世界網

? ??

? ? 兩人有限注德州撲克(HULHE)因為玩家的選擇比較少可以暴力計算,已經在2015年被Univ of Alberta解決,得到的策略離納什均衡點非常近了(見這篇文章,發上了Science,AI叫Cepheus,用的方法是CFR+)。

? ? 這次CMU和Alberta用的方法,也和之前的類似,都是Counterfactual regret minimization (CFR)的變種。這次的主要貢獻在于:

? ? DeepStack用上了Continuous Resolving,即動態地解子游戲以避開存儲海量策略時內存不足的問題,還有值網絡;

? ? CMU用了endgame solving以細化狀態空間和策略空間,當然他們的文章似乎還沒有公布,細節還不明朗(比如說剪枝應該是用上的)。

? ? CFR的思路非常簡單,從隨機策略開始,每次優化一個玩家的策略以提高其收益并反復迭代,最后取平均策略作為最終策略。每次優化用的是悔恨值最小化(Regret minimization)的辦法,所謂悔恨值就是事后最優選擇的收益,減去當時選擇的收益,悔恨值最小化就是把到目前為止的累計悔恨值拿過來,看哪一步累計悔恨值高,以后就多走這一步,至于多走的概率,有各種算法(比如說Regret Matching和Hedge)。

? ? 對于兩人零和游戲,可以證明CFR會收斂到納什均衡點,也就是“反正我就這么一招,你怎么也破不了”這樣的終極招數。所以計算機現在使用的算法,最終目的并不是要利用對方弱點獲得勝利,而是找出神功以達到無人可敵的境界。當然要達到這個境界,訓練過程中仍然是不斷找對方弱點讓自己變強。

? ? CFR是個帶有理論界的通用算法,說它可以解決一切的非對稱信息博弈問題也不為過。但是世界上自然沒有免費午餐,在跑CFR的時候,每次都要遍歷一次游戲所有可能的狀態,而任何一個稍微復雜點的游戲都有指數級的狀態,所以運行時間上肯定是不能接受的。

? ? 這就有很多折中辦法,比如說狀態量化(認為2到9都是小牌用同一個策略處理),剪枝(對方不太可能走這一步,那就不用再搜索下去了),隨機采樣(采樣一些路徑以代替全部的游戲分支),函數擬合(比如說用值網絡來代替深層搜索),等等。

? ? 總的來說,CFR和幾年前的RL很像,都是傳統AI的帶理論界的老方法,都是在現實問題中有指數復雜度,都是現在漸漸開始深度學習化,所以我相信以后會有更廣闊的發展。

(如需轉載,請注明來源自 科技世界網
2019年香港码头诗