學好觀點

【學好閱讀】當AI的理解力勝過人類的時候....

AI「閱讀理解」能力超越人類平均水準,書都給機器讀就好啦!

 

【為什麼我們要挑選這篇文章】2017 年看到科技公司卯起來開發語音、表情辨識的 AI 技術,以前 AI 只是讓「辨識」的能力優化,現在 AI 技術開始拓展到「理解」層次,甚至 AI 在某些領域的閱讀理解比人類更進步,人類社會本來的分工階層會怎樣被顛覆呢?(責任編輯:鄒昀倢)

      提起「閱讀理解」這四個字,你會想到什麼?

      被四六級、雅思、托福支配的恐懼?英語試卷上連原作者都搞不懂的選擇題?

我們以前都以為,只有人類擁有「閱讀理解」詮釋的能力

     不管哪種答案,肯定都逃不出一個規律:進行閱讀理解這項「有益身心運動」的主體,必然是跟你我一樣的人類。

      畢竟嘛,這東西需要閱讀一大段文字,然後理解了意義之後再做題目,堪稱一場英語考試中最複雜最費腦筋,也最考驗綜合能力的一個環節。所以你的英語老師一定說過這樣一句話:得閱讀理解者得天下。

AI 連閱讀能力都比人類好,我們還拿啥混口飯吃?

     但是,我如果告訴你今天得這個天下的,已經不再是人類而是 AI 了,你會怎麼想?也許此前我們想像過 AI 可以完成單詞聽寫、句子翻譯甚至寫作,但可能很多人可能都沒有想到,AI 做閱讀理解現在也能甩人類幾條街。

      可事實就是這樣,1 月 11 日,斯坦福大學著名的機器閱讀理解賽事 SQuAD 刷新了全球排名,阿里巴巴憑藉 82.440 的精准率打破了世界紀錄,超越了人類 82.304 的平均得分。

      當然了,AI 是不會去跟你比托福刷分的,這件事的背後,腦洞有點大哦……

什麼是機器閱讀理解?

     機器閱讀理解,雖然看起來只是讓 AI 上陣來一場考試。 但是卻是自然語言處理技術中,繼語音判斷、語義理解之後最大的挑戰: 讓智能體理解全文語境。

      而斯坦福大學發起的 SQuAD 挑戰賽,則是業內公認的機器閱讀理解最高水平賽事。

      SQuAD 挑戰賽的基本規則,是通過眾包的方式構建一個包含 10 萬個問題左右的大規模數據集,並給出來源於維基百科長度大約在幾百個單詞左右的文章。參賽者提交的 AI 模型在閱讀完數據集中的一篇短文之後,回答若干個基於文章內容的問題,答案與標準答案進行比對,最終得出成績。

      由於閱讀理解這項「智能」調整,需要運用到大量邏輯、細節和結構分析能力,並且直接作用於現實中的文本資料,所以實際價值很大。

      比如說,我們首先要面對的問題就是,假如 AI 已經比人類平均水平更擅長於對文本中的精准信息進行理解和回答,會帶給我們什麼呢?

當 AI 的「閱讀理解」得分超越人類,意味著?

      舉個例子或許可以很簡單地理解這個問題:英語考試上,當 AI 可以翻譯單詞的時候,我們一點都不驚奇;但 AI 可以聽寫整句話的時候,我們會感嘆技術進步了;當 AI 自己做閱讀理解的時候,我們大概會想,還要我考這個試幹什麼?

      這裡面的差別,在於處理閱讀理解相關問題時,AI 不只是要運算和記錄,而是要主動去分析和理解。所以 閱讀理解問題一直被人當成是 NLP 的標誌性臨界點。但這個點被 AI 破解,直接意味著原本很多必須由人類才能完成的工作,已經能夠被 AI 接管。

      因為閱讀理解問題,不只是要處理語音和簡單的語義,而是要理解和關注詞彙、語句、篇章結構、思維邏輯、輔助語句和關鍵句等等元素構成的複雜組織網絡。

      機器閱讀理解達標,最直接的產業影響是大多數今天還必須由人工完成的規則、對話、服務信息類的相關工作,都可以被 AI 所取代。比如說客服、訊息管理和推薦類的工作,都可以考慮用不眠不休、高運算速度的機器來取代。

AI 閱讀技術提升,第一個會被影響的是「客服」行業

      或許我們都注意到了這樣一個問題:今天的互聯網世界,文本內容變得越來越多,各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙 11 想要剁個手,都有各種各樣的遊戲規則等著你。自己讀吧,太累太痛苦還沒時間,問客服吧,很可能出錯還很慢,簡直是薛定諤式問題。

      這裡或許就可以用 AI 閱讀理解來解決了。比如客戶對某個電商促銷規則有疑問,就可以直接向 AI 提問,而 AI 就可以把這個問題當做閱讀理解來進行解決方案回饋。

      AI的閱讀理解能力,將在如何向客戶提供非模板式的智慧客服服務中發揮作用。而當 AI 在這些能力上超越人工,那麼 AI 客服的利用價值將可能快速提升。換句話說,AI 客服終於可以不那麼機械化了。

      由此不難看出, 這種關鍵能力的突破,對大量強調與普通消費者交互的產業線益處最多。

      推而廣之,AI 閱讀能力也是文娛領域進行內容尋找和推薦的有效方式,比如閱讀用戶提出的複雜需求,進行精準推薦;與 IoT 產品相結合,給出對用戶大段語言的回饋,乃至對話互動,都必須以機器理解能力為依托。

AI理解力的提升,象徵未來技術的進步幅度可能加廣、加大

      除了知道 AI 可以充當更好的客服之外,究竟我們為什麼應該關注 AI 閱讀理解這件事?或許關鍵,是我們應該知道理解力在目前 AI 世界中的重要程度和期待指數。

      AI 作為一種從計算機科學下的分支,一個智能體先天具備的是運算能力,而希望進行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機器視覺、語音識別、語義理解,都是在做這件事。而第三步,就是讓 AI 產生理解力。

      顯然,識別有著龐大應用場景,並會在接下來很長一段時間內佔據主流。但是 AI 的理解能力是大多數識別能力的進化,假如單純識別出卻無法產生輸出,那麼 AI 無非只是更靈活的傳感器而已。

      從這個邏輯上看,閱讀理解對於 AI 來說絕不僅僅是個測試,或者商業應用的技術加持,更重要的是開啟 AI 紀元理解力的加速器。

      更廣闊的意義在於,當我們不再考慮 AI 是否能理解人類文本和語言,那麼 DeepNLP 將可能達成,人機交互的範圍將級擴大。AI 可以開始捕捉人類的邏輯。

      可能那還很遠,也可能很近,但機器理解力讓我們在未來面前不再是個孩子,這應該是毫無疑問的。

- - - -

【學好閱讀回饋】

〈您的孩子是「說話」,還是「溝通」?〉

撰文/石廷宇     對象:國小   分類:閱讀教育    地區:天母/古亭/士林/北投

     有越來越多科技公司,著手研發AI(Artificial Intelligence)的「語意分析」(semantic analysis)系統,同一時間,我們卻也越來越擔心,我們的孩子事實上正在逐步掉入「無法有效分析語意」的學習困境。

     建立在「大數據」的AI人工智慧,透過不斷累積、重組、編織語法,使得它們越來越具備人類的心智思維與智能,(PS.絕不止於下棋而已)。反之,我們的孩子所累積與吸收的文字素材與訊息,卻顯得日漸稀薄短少。相較於插著電就能持續吸收、運作的電腦,人腦非但需要休息,更需要緩衝;然而,花了很大時間在記憶、誦讀、考試的孩子,常常在「讀完課內書」後,再無暇、也無餘力吸收「課外知識」,也因此,我們的孩子便逐步掉入「語意分析匱乏的陷阱」。

      語意分析,牽涉的範圍包括以下幾個部分:

      A.分析出該個段落的摘要以及大意

      B.整理通篇文章(影片、演講、視覺、電影)的意思

      然而,若我們細問孩子,剛剛這段影片演了什麼關鍵情節?剛剛那位講者說了什麼重點?往往得到的答案卻都是「情緒性、感性、無法量化分析」,甚至是「粗糙化」、籠統的形容詞彙。這表示,我們的孩子在語意分析方面,已經出現了需要跨越的瓶頸。一旦孩子所經驗的閱讀對象隨著年齡、知識範圍、學習深度而增加、擴充,然而孩子的語意分析能力卻未能跟得上他的成長腳步,就好像用286電腦再處理千禧世代的資訊流量一樣,將顯得左支右絀。

      因此,回到本文的題目:「說話」(talk)與「溝通」(communication),是兩種截然不同的語意操作深度。雖然孩子們同樣張著口、發著聲,但是,正是在是否有效編織和組成上,我們很清楚地可以得知兩者之間鮮明的差異。

      沒有恰當的閱讀方式,沒有正確的理解渠道,孩子如何擁有適切的語意分析能力,來幫助自己持續提升自己的能力?

AI「閱讀理解」能力超越人類平均水準,書都給機器讀就好啦!

 

【為什麼我們要挑選這篇文章】2017 年看到科技公司卯起來開發語音、表情辨識的 AI 技術,以前 AI 只是讓「辨識」的能力優化,現在 AI 技術開始拓展到「理解」層次,甚至 AI 在某些領域的閱讀理解比人類更進步,人類社會本來的分工階層會怎樣被顛覆呢?(責任編輯:鄒昀倢)

      提起「閱讀理解」這四個字,你會想到什麼?

      被四六級、雅思、托福支配的恐懼?英語試卷上連原作者都搞不懂的選擇題?

我們以前都以為,只有人類擁有「閱讀理解」詮釋的能力

     不管哪種答案,肯定都逃不出一個規律:進行閱讀理解這項「有益身心運動」的主體,必然是跟你我一樣的人類。

      畢竟嘛,這東西需要閱讀一大段文字,然後理解了意義之後再做題目,堪稱一場英語考試中最複雜最費腦筋,也最考驗綜合能力的一個環節。所以你的英語老師一定說過這樣一句話:得閱讀理解者得天下。

AI 連閱讀能力都比人類好,我們還拿啥混口飯吃?

     但是,我如果告訴你今天得這個天下的,已經不再是人類而是 AI 了,你會怎麼想?也許此前我們想像過 AI 可以完成單詞聽寫、句子翻譯甚至寫作,但可能很多人可能都沒有想到,AI 做閱讀理解現在也能甩人類幾條街。

      可事實就是這樣,1 月 11 日,斯坦福大學著名的機器閱讀理解賽事 SQuAD 刷新了全球排名,阿里巴巴憑藉 82.440 的精准率打破了世界紀錄,超越了人類 82.304 的平均得分。

      當然了,AI 是不會去跟你比托福刷分的,這件事的背後,腦洞有點大哦……

什麼是機器閱讀理解?

     機器閱讀理解,雖然看起來只是讓 AI 上陣來一場考試。 但是卻是自然語言處理技術中,繼語音判斷、語義理解之後最大的挑戰: 讓智能體理解全文語境。

      而斯坦福大學發起的 SQuAD 挑戰賽,則是業內公認的機器閱讀理解最高水平賽事。

      SQuAD 挑戰賽的基本規則,是通過眾包的方式構建一個包含 10 萬個問題左右的大規模數據集,並給出來源於維基百科長度大約在幾百個單詞左右的文章。參賽者提交的 AI 模型在閱讀完數據集中的一篇短文之後,回答若干個基於文章內容的問題,答案與標準答案進行比對,最終得出成績。

      由於閱讀理解這項「智能」調整,需要運用到大量邏輯、細節和結構分析能力,並且直接作用於現實中的文本資料,所以實際價值很大。

      比如說,我們首先要面對的問題就是,假如 AI 已經比人類平均水平更擅長於對文本中的精准信息進行理解和回答,會帶給我們什麼呢?

當 AI 的「閱讀理解」得分超越人類,意味著?

      舉個例子或許可以很簡單地理解這個問題:英語考試上,當 AI 可以翻譯單詞的時候,我們一點都不驚奇;但 AI 可以聽寫整句話的時候,我們會感嘆技術進步了;當 AI 自己做閱讀理解的時候,我們大概會想,還要我考這個試幹什麼?

      這裡面的差別,在於處理閱讀理解相關問題時,AI 不只是要運算和記錄,而是要主動去分析和理解。所以 閱讀理解問題一直被人當成是 NLP 的標誌性臨界點。但這個點被 AI 破解,直接意味著原本很多必須由人類才能完成的工作,已經能夠被 AI 接管。

      因為閱讀理解問題,不只是要處理語音和簡單的語義,而是要理解和關注詞彙、語句、篇章結構、思維邏輯、輔助語句和關鍵句等等元素構成的複雜組織網絡。

      機器閱讀理解達標,最直接的產業影響是大多數今天還必須由人工完成的規則、對話、服務信息類的相關工作,都可以被 AI 所取代。比如說客服、訊息管理和推薦類的工作,都可以考慮用不眠不休、高運算速度的機器來取代。

AI 閱讀技術提升,第一個會被影響的是「客服」行業

      或許我們都注意到了這樣一個問題:今天的互聯網世界,文本內容變得越來越多,各種各樣的信息爆炸而來。太多你知道的、你不知道的、你以為自己知道的卻實際不知道的事情呼嘯而過。甚至你雙 11 想要剁個手,都有各種各樣的遊戲規則等著你。自己讀吧,太累太痛苦還沒時間,問客服吧,很可能出錯還很慢,簡直是薛定諤式問題。

      這裡或許就可以用 AI 閱讀理解來解決了。比如客戶對某個電商促銷規則有疑問,就可以直接向 AI 提問,而 AI 就可以把這個問題當做閱讀理解來進行解決方案回饋。

      AI的閱讀理解能力,將在如何向客戶提供非模板式的智慧客服服務中發揮作用。而當 AI 在這些能力上超越人工,那麼 AI 客服的利用價值將可能快速提升。換句話說,AI 客服終於可以不那麼機械化了。

      由此不難看出, 這種關鍵能力的突破,對大量強調與普通消費者交互的產業線益處最多。

      推而廣之,AI 閱讀能力也是文娛領域進行內容尋找和推薦的有效方式,比如閱讀用戶提出的複雜需求,進行精準推薦;與 IoT 產品相結合,給出對用戶大段語言的回饋,乃至對話互動,都必須以機器理解能力為依托。

AI理解力的提升,象徵未來技術的進步幅度可能加廣、加大

      除了知道 AI 可以充當更好的客服之外,究竟我們為什麼應該關注 AI 閱讀理解這件事?或許關鍵,是我們應該知道理解力在目前 AI 世界中的重要程度和期待指數。

      AI 作為一種從計算機科學下的分支,一個智能體先天具備的是運算能力,而希望進行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機器視覺、語音識別、語義理解,都是在做這件事。而第三步,就是讓 AI 產生理解力。

      顯然,識別有著龐大應用場景,並會在接下來很長一段時間內佔據主流。但是 AI 的理解能力是大多數識別能力的進化,假如單純識別出卻無法產生輸出,那麼 AI 無非只是更靈活的傳感器而已。

      從這個邏輯上看,閱讀理解對於 AI 來說絕不僅僅是個測試,或者商業應用的技術加持,更重要的是開啟 AI 紀元理解力的加速器。

      更廣闊的意義在於,當我們不再考慮 AI 是否能理解人類文本和語言,那麼 DeepNLP 將可能達成,人機交互的範圍將級擴大。AI 可以開始捕捉人類的邏輯。

      可能那還很遠,也可能很近,但機器理解力讓我們在未來面前不再是個孩子,這應該是毫無疑問的。

- - - -

【學好閱讀回饋】

〈您的孩子是「說話」,還是「溝通」?〉

撰文/石廷宇     對象:國小   分類:閱讀教育    地區:天母/古亭/士林/北投

     有越來越多科技公司,著手研發AI(Artificial Intelligence)的「語意分析」(semantic analysis)系統,同一時間,我們卻也越來越擔心,我們的孩子事實上正在逐步掉入「無法有效分析語意」的學習困境。

     建立在「大數據」的AI人工智慧,透過不斷累積、重組、編織語法,使得它們越來越具備人類的心智思維與智能,(PS.絕不止於下棋而已)。反之,我們的孩子所累積與吸收的文字素材與訊息,卻顯得日漸稀薄短少。相較於插著電就能持續吸收、運作的電腦,人腦非但需要休息,更需要緩衝;然而,花了很大時間在記憶、誦讀、考試的孩子,常常在「讀完課內書」後,再無暇、也無餘力吸收「課外知識」,也因此,我們的孩子便逐步掉入「語意分析匱乏的陷阱」。

      語意分析,牽涉的範圍包括以下幾個部分:

      A.分析出該個段落的摘要以及大意

      B.整理通篇文章(影片、演講、視覺、電影)的意思

      然而,若我們細問孩子,剛剛這段影片演了什麼關鍵情節?剛剛那位講者說了什麼重點?往往得到的答案卻都是「情緒性、感性、無法量化分析」,甚至是「粗糙化」、籠統的形容詞彙。這表示,我們的孩子在語意分析方面,已經出現了需要跨越的瓶頸。一旦孩子所經驗的閱讀對象隨著年齡、知識範圍、學習深度而增加、擴充,然而孩子的語意分析能力卻未能跟得上他的成長腳步,就好像用286電腦再處理千禧世代的資訊流量一樣,將顯得左支右絀。

      因此,回到本文的題目:「說話」(talk)與「溝通」(communication),是兩種截然不同的語意操作深度。雖然孩子們同樣張著口、發著聲,但是,正是在是否有效編織和組成上,我們很清楚地可以得知兩者之間鮮明的差異。

      沒有恰當的閱讀方式,沒有正確的理解渠道,孩子如何擁有適切的語意分析能力,來幫助自己持續提升自己的能力?