主頁 > it > 正文
會改變傳統IT行業的工作形式?
发表时间:2020-07-31 19:31

會改變傳統IT行業的工作形式?



機器能否理解自然語言並准確翻譯爲機器代碼
在剛開始看到GPT3的相關文章時,給我帶來了巨大的沖擊。因爲在之前學習c語言時有老師是這麽介紹c語言的,因爲機器聽不懂人說話,所以需要有一個機器聽得懂得語言作爲人給機器的命令輸入;如果你說的話機器聽得懂,你就可以用中文編程。而現在有人告訴我,機器聽得懂人說話了!
 
文中是這樣介紹GPT3的:
 
在設計網頁的過程中,可以輸入我要一個“長得像西瓜得按鈕”機器就會自動生成以下的按鈕:
 
 
可以看到,在對話框內是輸入的自然語言,在對話框下是機器生成的html代碼以及按鈕的預覽圖片。
 
不行否認在自然語言理解這一領域,這是個跨越式的創新,但是,我認爲在短期內,這項技術並不能成爲真正改變生産力和生産關系的工具。也許可以在網站建立初期使用GPT3建立一個大概的框架,或者是使用GPT3找找網站設計的靈感,但是GPT3不行能替代html、js等網絡編程語言成爲開發人員的首選。
 
本文將主要針對語言的歧義、人機交互的方式結合最近看的《自然語言處理問答》和《交互設計:逾越人機交互》(第五版)這兩本書展開論述。
 
自然语言和现有的Html代码之间的关系,类似与python、java等脚本语言相对于c、汇编语言的关系。为什么会有计算机语言的产生,是因为计算机读不懂自然语言,所以有经验的计算机工程师建立了一套计算机可以理解的体系,然而这套体系是需要从底层一层一层建立的,从机器码到汇编语言,再到高级语言。从高级的面向对象语言改进到现在是不停适应人们的自然语言习惯的,在c语言中输出还需要定义输出的变量的类型printf("num=%d",num):在c++的输入输出流中就去除了这一步要求,std::cout<<"num="<<num;这样的改进是为了增加这个语言系统的容错性能,例如在不知道这个变量是什么类型的时候仍然可以正常输出。但是每一步的改进都是有利有弊的,python 作为一个易于上手的语言可以说对新手较为友好了,又有丰富的类库可以使用,可能使用opencv实现一个边缘检测或者是使用keras建立一个小的回归模型只需要几行代码就够了。然而Python也并不是一个容易精通的语言,因为python的解释器会在背后做着我们所不能一眼看出来的转换,可能我们以为我们重新定义了一个变量并用已有变量对其进行了赋值,实际上编译器认为我们创建了一个指向现有变量的引用,这就是语言的歧义,连python这类专门设计的计算机语言都经常会出现这种歧义,自然语言更是如此。
 
那麽如何減少歧義,就是重中之重。劉偉老師在《追問人工智能》一書中寫道:人機融合智能需要發揮人機各自的長處,只有人機很好地配合在一起才气實現1+1>2的效果(例如輔助決策的過程),在這樣的要求下,機器需要學習人,人也需要適應機。在《交互設計:逾越人機交互》(第五版)這本書中提到了交互中很重要的一點,即心智模型,人在使用機器時需要運用正確合適的心智模型,那麽什麽是正確的心智模型?例如在使用空調制熱時,空調加熱的速度並不會因爲溫度設定的高低而變快變慢,那麽在設定溫度時,就只需要設定一個需要達到的溫度,而不是先將溫度調高于期望溫度,希望升溫迅速,達到期望溫度後再調回期望溫度。合理正確的心智模型可以使得人機間的交互更加和諧,爲了達到這樣的效果,在機器設計的過程中就需要考慮到用戶在使用時的因素,需要設計一個更爲透明的産品給用戶一個清楚的認知過程從而幫助建立合理的心智模型,而用戶使用時同樣需要閱讀說明書來獲取建立正確的心智模型,心智模型在人機交互的過程中就是人機之間的一座橋梁,正確映射人類想法和機器實操。放在人機交互的過程中,機是有一定靈活性的,可以通過現有機器學習的方法學習用戶的習慣,性格等特征,更好地輔助用戶。當機器讀不懂用戶給的指令,或是用戶的指令模糊不清時,就會産生歧義。
 
 
此時引入了歧義這個概念
 
機器在靈活地同時又會帶來歧義,如果機器對用戶的命令解析不正確,往往會背道而馳。在李維老師《自然語言處理問答》這本書中,大量的篇幅用來解釋如何消除自然語言分析的歧義,同時也提到了可以保留一些歧義,在過早剪枝和維度爆炸兩種情況之間找到平衡點。香農對信息的定義爲“信息是用來消除隨機不定性的東西”。同樣的,在自然語言的處理中的消歧也是同樣的道理,若是在分詞階段過早消歧,計算機在少量的信息前只能使用專家指定的規則和字典中的注釋來選出當前最合適的內容,此時極容易産生誤讀,又由于分詞處在分析的第一步,會産生錯誤的疊加。
 
適度的保留歧義,舉《自然語言處理問答》一書中的例子:49年既可以理解爲四十九年也可以理解爲1949年,此時産生了歧義,但是這類歧義是面向內部的歧義,無論是四十九年還是1949年都是一個時間身分,不影響對下文或是句式結構的解讀。若是遇到無法幸免結構上的歧義,可以選擇性得保留另外一枝,數中提出了休眠和激活這一方法,可以將可能性較小得那一枝結構休眠,如果解析得過程中發現激活那一枝的條件,則重新激活另一支結構。
 
談到消除歧義的問題,在自然語言處理方面我不能班門弄斧,接下來會結合人機交互談一點自己的看法。
 
 
因爲當前的自然語言處理屬于無人系統,所以會遇到如此多的麻煩困難,但是如上文介紹的GPT3系統,既然是面向使用自然語言編程的,自然包罗了人機的互動,許多系統自生難以消除的歧義可以同過和人的交互消除,機器可以對難以消除的歧義提問,而用戶可以根據自己的想法理解回答,在李維老師《自然語言處理問答》一書中同樣提到了在系統的使用過程中可以在遇到新詞時更新詞典詞,或者使用一些統計方法讓系統自動更新建立詞彙之間的隱含聯系。上文的例子中,給我一個像西瓜一樣的按鈕,並沒有輸入按鈕的大小,按鈕的位置,按鈕的點擊方式(雙擊,單機,長按),這些可能都是機器根據自己系統中的信息儲備來定義的,然而要真正實現用自然語言編程,用戶需要對細節可控,因爲這些細節在真正應用到實際的生産生活中是非常重要的。正如現在的IDE變得越來越方便,當前的IDE在輔助用戶編程時接纳的措施是搜索首字母或是關鍵字自動出現下拉框,框中有用戶可能會選擇的函數題和變量名,這類輔助的方式我將其姑且稱爲提醒方式,也就是機器用相比人類近乎于無限的記憶力(儲存空間)幫用戶省去了記住繁瑣的變量名的過程,可以將注意力集中在程序邏輯上。在GPT3這個系統中,應該設置詢問用戶細節的環節,用戶想要一個按鈕,那麽系統告知用戶建立一個按鈕需要設置多少參數,引導用戶一個個填充輸入,然而這樣又失去了使用自然語言編程簡單,開放性強的初衷。所以我覺得GPT3作爲一個自然語言分析系統的展品是十分精彩的,代表了前沿的自然語言處理技術,同時它也展現了這項技術在工業界的應用;但是在自然語言編程這一條路上,它走的還不夠遠,所以目前爲止,我依舊認爲使用自然語言編程還停留在一個基本的構想階段,要真正實現應用還有很長的路要走。
 
最後的結論有些令人失望,但是我依舊對未來人工智能的發展滿懷期待,期待機器真正聽得懂人說話的一天早一些到來!
 

文明播報

南昌國體中心內“藏”有會所式餐廳?
移動助力公安精准打擊電詐犯罪
助力江西打贏汛期“保衛戰”
江西省産業扶貧一線的見聞
中醫院緊急醫學救援隊開赴抗洪一線
22項重點任務加強全省水上搜救工作
南昌新力禧園物業違章搭建
南昌縣:大堤上的“流動診所”
江西定南促生豬複産增養

it

會改變傳統IT行業的工作形式?
以退爲進,爲5G競爭握拳蓄力
全光網絡萬億價值鏈重啓
5G千元機時代很快到來
打造“5G+工業互聯網”融合發展新高地
“5G+”制造成5G應用落地“先遣軍”
5G成“智”造時代關鍵一環
工業互聯網助推制造業轉型升級
爲決戰5G時代,小米脱手不模糊

重慶時時彩

中了一千万, 扣完税就能把钱领走?
彩民“清醒”了彩票銷量減少875億
中了彩票大獎能跳出鄙視鏈嗎?
雙色球開獎結果,獨藍號15
獎池“沖向”100億,彩票銷量下跌?
爲何有人在彩票店中寫寫畫畫
隨機選號和自主選號有區別嗎
遼甯大連彩票再次按下暫停鍵
开展體育彩票“点亮健康中国”活动
友情鏈接:福彩
網站地圖

以上整理自互聯網如有侵權請及時聯系我們進行刪除,謝謝!聯系郵箱:sheng6665588@gmail.com