新書簡介 新書推薦

人工智能與出版業的數字化轉型

《第五代:人工智能與日本計算機對世界的挑戰》

孫喜

2020年07月31日 01:48

陳昕
《 中华读书报 》( 2020年07月22日 16 版)

一般说来,技术主题的图书的生命周期都不会太长,十年二十年就会被替代,除非是那些思想辉光灼人的著作,才会有耐久阅读的价值,就像沉缸许久的佳酿。格致出版社新近重版的图灵奖得主爱德华·A.费吉鲍姆和专栏作家帕梅拉·麦考黛克于近四十年前合作撰写的《第五代:人工智能與日本計算機對世界的挑戰》,就是这样一部思想火焰不息的著作,有着重要的阅读和反思价值。

自從1956年在美國新罕布什爾州漢諾佛小鎮達特茅斯學院召開的人工智能夏季研討會掀起第一波人工智能浪朝至今,人工智能已經走過了六十多年的曆程,其中有過幾波高潮,也曾長時期地陷入低潮。進入21世紀後,伴隨著機器人、移動互聯網、大數據、超級計算、神經網絡、傳感網等理論和技術的發展與成熟,人工智能開始加速發展。2016年“阿爾法狗”擊敗李世石,機器人對人類圍棋冠軍的首次勝利迅速掀起了新的人工智能浪潮。以深度學習爲引領的人工智能應用,在計算機視覺、語音識別、自然語言處理、人工神經網絡等領域取得突破性進展,從而人工智能滲入社會每個細胞。從政府到研究機構,從企業到個人,人們對于人工智能的熱情再度高漲。仔細地分析當下人工智能的最新進展,發現不少在費吉鮑姆和麥考黛克這本近四十年前出版的圖書中已有預言或提及。

這本圖書的主旨在于介紹第五代計算機,即具有人工智能的計算機。在這之前計算機已經發展過四代,那就是四五十年代的電子管計算機,五六十年代的晶體管計算機,六七十年代的集成電路計算機,七八十年代的超大規模集成電路計算機。第五代計算機最先是由日本在1981年提出並加以規劃和進行項目實施的,所以費吉鮑姆和麥考黛克在書名中直截了當地點明這是日本計算機對世界的挑戰。令人遺憾的是,日本的這個項目並沒有成功,十年後漸漸偃旗息鼓,至今在人工智能領域還大大落後于美國,這其中有太多值得總結的東西。比如,如何看待科技進步、工業發展過程中的市場作用和政府作用,如何看待學習模仿和自主創新,如何看待國家間的産業競爭和合作,等等。當然,這本近四十年前出版的圖書不太可能涉及一個當年剛剛開始的五代機項目的未來成敗及原因分析,但費吉鮑姆和麥考黛克在過了差不多四十年後的今天爲此書中文版所寫的序言中僅對日本五代機項目的失敗作了些技術層面的總結,而對深層次的原因則語焉不詳,未免讓人很不過瘾。不過,當年他們在這本書中詳細介紹了日本政府欲以8.5億美元巨額預算開發第五代計算機系統的過程,以及日本爲五代機項目特別設立的“新一代計算機研究所”(TCOT)的運行情況,這爲我們今天總結這段人工智能發展史上具有重要節點意義的曆史提供了基本的材料。

這本圖書介紹了第五代計算機的核心價值和技術,重點討論了“專家系統”的設計和理論,研究了五代機一旦開發成功將對人類社會産生什麽樣的影響,以及各國在當時作出的種種應對,還附有實驗性的與付諸使用的“專家系統”選錄和五代機研究開發論題。這本書既談技術又談戰略,既談經濟也談政治,而戰略眼光的敏銳和超前是其經久不衰生命力的基石。

鬥轉星移,人類已經邁進人工智能的新時代,這本圖書在許多方面都給讀者帶來啓示,引發人們思考人工智能在未來對世界帶來的各種各樣的挑戰和機遇。對出版人的啓示是,一方面我們應該清楚,在信息化、數字化、人工智能的時代,掌握知識內容的重要性,這是出版企業賴于生存的根本;但這些內容應該是系統的成體系的,這就要求我們把主要的精力放在知識的選擇、整理和提升上。另一方面,我們在建設和提供成體系的知識系統時,還必須要有知識工程的理念,學會運用知識表達、知識利用、知識獲得的人工智能技術來整合和發掘內容,這樣才有可能通過機器的“深度學習”産生“習得知識”,滿足讀者生生不息的潛在需求,擴展出版業的發展空間,進而完成傳統出版向現代出版的轉型。

這本圖書對出版業的意義還在于,不僅告訴了我們人工智能的基本理論和核心技術,還向我們提供了建設知識庫的方法和路徑,其中最重要的是“專家系統”的理論和技術,費吉鮑姆就是因爲在這個方面的貢獻而獲圖靈獎並被稱爲“專家系統之父”的。“專家系統”在上一波人工智能研發高潮中處于主要的位置,它是第五代計算機的核心,在新一波高潮中由于新技術的賦能仍然發揮著重要作用。

本書用一章的篇幅,詳盡地介紹了“專家系統”。它是一個在某一專門領域或方面已被賦予知識和才能的計算機程序,一個達到或超過專家水准的專門知識系統,一個人類專家的具有高水平智能的助手。它包括人機接口、推理和知識庫管理三個子系統。專家系統主要是依靠許多知識來發揮功能的,因此衆多的專家系統按照一定的結構集合在一起,便形成了“知識庫”,用來存儲事實、假設、信念和探試,以及專業知識等,並處理數據庫以達到諸如診斷、解釋或解決問題等預期目標。而設計和建造專家系統及知識庫程序的技術就是“知識工程”。書中還介紹了專家系統已經應用的領域,剖析了若幹專家系統建構的案例,包括場景、框架和推理,敘述了運用計算機來描述知識,利用知識來創造出推理程序,進而將挖掘出的知識精華編成知識庫的過程,從而把知識表達、利用和獲得的框架和程序展示給我們,這對出版業如何建構各類專業知識庫具有重要的借鑒意義。這些年來,我國出版業建設專業知識庫的呼聲不絕于耳,但對如何建構卻知之甚少,一碰到具體問題便束手無策,以至到今天,除了建構個別語言工具類的知識庫外,其他方面建庫的嘗試還很少進行。人工智能在當下,專家系統的重要性更加凸顯,“阿爾法狗”告訴我們,依托于專家系統,計算機也可以通過“深度學習”來産生並獲得知識,這意味著知識的主體已經不僅僅是人,也可以是機器。這對出版業未來的發展提供了新的思路,也是全新的挑戰。問題在于出版人是否認識到這一點,是否准備迎接挑戰。

2007年我在考察美國數字出版歸來後,曾撰寫長文討論數字出版的商業模式。在那篇文章中,我把全球出版業業已開展的數字出版的商業模式分爲三類。(1)網絡營銷:利用網絡和數據庫推動傳統出版的發展,實現紙質圖書市場的擴容,達到業績提升、服務改進、顧客滿意度提高的目的。在這裏網絡是作爲傳統出版營銷升級的工具。(2)網絡運營:主要在網絡平台上生産經營內容資源,創造出新的成本—營收模式,實現運營的最優化、效益的最大化,並形成可持續贏利的商業模式。在這裏網絡是作爲內容産業的生産經營平台。(3)網絡營銷+網絡運營:網絡既作爲傳統出版營銷升級的工具,也作爲內容産業的生産經營平台。

十多年過去了,我們看到西方主要發達國家出版業在這三類商業模式的運營上都取得了長足的進步。尤其是在網絡運營上,科學、技術、醫學和學術類的專業出版企業通過建立超大規模的專業數據庫和全新的在線平台,很大程度上滿足了專業機構和專業人員的個性化需求,創造了很好的業績,以至這部分營收已經占到其全部營收的大部分。對他們而言,樹立人工智能的理念,運用人工智能的技術,進一步加強和完善專家系統和知識庫的建設,建立強大的知識工程,以達到通過“機器的深度學習産生習得知識”的狀態,可能是下一步需要重點解決的問題。

對我們而言,這些年來基本上是在網絡營銷的層面兜圈圈,最近兩年又熱衷于開展“抖音”之類短視頻APP的營銷(這當然也是應該做的事),而在網絡運營的層面則左右搖擺,舉棋不定,很少有出版企業在專業知識庫上下功夫的,更遑論運用人工智能的理念和技術來提升知識信息處理能力,拓展出版業發展的新的空間了。這可能也與我們對人工智能的認識不足有關。業內不少人士對人工智能的注意力僅僅集中在數字出版流程的再造上,由“編、審、校、印、發”等環節的機械數字化轉向協同一體的智能數字化,興趣也限于各種新興技術對人工智能的賦能上,而對人工智能的本質在于知識信息的處理以及建設專家系統和知識庫的意義則不甚了了,理解不夠,這樣的一種狀態是難以真正推進出版業的數字化轉型的。正因爲如此,我鄭重地推薦出版業人士都來讀一讀費吉鮑姆和麥考黛克的這本超級“長命”的圖書。


]]>

2020年07月31日 09:46
3415
楊小平《三國志研究史》出版