<acronym id="pokdi"><strong id="pokdi"></strong></acronym>
      <acronym id="pokdi"><label id="pokdi"><xmp id="pokdi"></xmp></label></acronym>

      <td id="pokdi"><ruby id="pokdi"></ruby></td>
      <td id="pokdi"><option id="pokdi"></option></td>
      <td id="pokdi"></td>

        1. 教育裝備采購網
          第八屆圖書館論壇 校體購2

          神經網絡翻譯幫助我們更好理解人工智能

          教育裝備采購網 2017-04-28 17:03 圍觀723次

            2017GMIC(全球移動互聯網大會)未來創新峰會上,網易有道首席科學家段亦濤發表了《機器翻譯皆有道》的主題演講,分享了其在神經網絡翻譯領域的研究,并表示該技術將在有道詞典、有道翻譯官、有道翻譯網頁版等產品上陸續上線,這意味著超7億有道用戶將便捷地享受到這一技術帶來的便利。段亦濤表示,神經網絡翻譯是人工智能在翻譯領域的具體應用,是目前最前沿的機器翻譯技術,它帶來的翻譯質量提升是過去十年的總和。

            

            以下是其演講原文(有刪減):

            大家好,很高興有機會在這里跟大家分享有道在機器翻譯方面做的一些探索。先簡單自我介紹,我是網易有道首席科學家,本科和碩士在北航學飛機設計專業,博士在加州大學伯克利分校學計算機科學。之后我就加入了網易有道,目前主要關注機器學習領域,尤其是深度學習在機器翻譯、圖象識別、在線教育等方面的應用。

            神經網絡翻譯質量提升 是過去十年總和

            有道其實很早就開始做機器翻譯,我們在2008年就推出了機器翻譯的服務,應該是國內最早推出這一服務的互聯網公司。這兩年我們更關注把深度學習接入機器翻譯領域,我們研究成果是非常顯著的,我們的機器翻譯質量有非常大的提升。

            我們先看兩個例子,給大家一個直觀的感受。第一個例子是英譯中的,我們隨便從外媒選取了一段新聞報道,報道內容是關于前段時間巴黎恐怖事件。我們用各個翻譯引擎來進行了翻譯,第一個是統計翻譯模型,第二個是我們的神經網絡翻譯模型,第三種是某海外的神經網絡翻譯引擎。

            

            從上面的結果可以看出來,統計翻譯模型的結果拼湊感非常明顯,而且有些片斷翻譯還搞錯了,整體來看很不通順;有道的翻譯結果,可以看到是相當的準確和流暢的;第三個國外神經網絡翻譯模型的結果,可以看到不少的不準確的地方。

            

            我們再來看一個中譯英的例子,我們摘取了機器之心前段時間發布的一條消息。我們主要看看各家神經網絡翻譯的結果,可以看到,有道上線的神經網絡翻譯的結果,仍然是通順和準確的,這里面幾乎沒有任何語法錯誤。這個結果,即使是普通人中等英文水平,都很難達到,但是我們的神經網絡翻譯做到了。再來看另個國外神經網絡模型的翻譯結果,其實還是看出有明顯的不合適的地方,比如“起起伏伏”以及一些詞之間的關系搞錯。

            也許有人會問,這些例子是不是精心挑選出來的。事實上,以上兩個例子只是我們隨機選出的兩個,沒有特別的篩選。我們對質量的評測非常嚴格和客觀,我們采用龐大的評測數據集,并在這個數據集上看整體的質量。大家可以下載有道翻譯官App直接體驗這個最新的翻譯結果。

            另外我們再看兩個數字,首先有道過去兩年研究神經網絡翻譯所帶來的質量提升差不多是過年十年質量提升的總和,同時這個技術很快會被有道旗下的超過7億的用戶便捷地享受到。

            人工智能改變翻譯 更聰明更高效

            神經網絡模型是一個很前沿的技術,那它為什么能夠在機器翻譯領域能起到如此大的作用呢?實際上,神經網絡模型模仿了人腦的工作機制,整個模型由大量的“神經元”來構成,一個“神經元”完成一些簡單的任務,然后通過對這些“神經元”的組合來協調工作,最終得到更加出色的效果。

            而以前的統計翻譯模型更像一個機械系統,它由很多個組件來構成,包括短語組件、分詞組件、條序組件還有原模型等等。每個模塊都是有各自的功能和各自的目標,然后機械地拼裝在一起,完成一個翻譯的結果。和它相比,神經網絡翻譯模型更像一個有機體,模型里面有很多參數,這些參數都是為同一個目標來調整和優化的;它們中間的結合和交互更加有機,所以整體效果會更好。

            另一個不同是,兩種模型的內部信息的表達方式也不一樣。在統計翻譯模型里,其表達方式能夠識別詞,但卻不能夠表達詞與詞之間的關系,比如兩個詞的詞義是相似還是相反的。而我們的神經網絡翻譯模型,它使用一個十數位的向量來表達每個詞,它的表達能力更豐富、更靈活,以及能夠更好地來表達詞和詞之間的關系。比如說“計算機”和“電腦”這兩個詞,那么它們很可能在向量空間里離得很近。這種表達方式能夠顧及到更多這樣的關系,它的內部表達是一個有機整體,從而生成更通順的翻譯結果。

            

            正如剛才所說,有道很早就開始研究機器翻譯領域,我們今天之所以在神經網絡翻譯領域能夠獲得這樣的效果,有幾方面的原因。

            首先,有道在機器翻譯領域深耕了近十年,我們積累了大量的優質的語料和技術。我們依托有道詞典積累的語料和用戶數據,能夠在英語學習這種翻譯場景下做到最好。其次,我們更加關注中文和其他外語之間的翻譯,所以火力更加集中,我們針對中文特有的語言現象做了非常多的優化,包括中文的分詞等等。這些優化都直接體現在最終的翻譯結果中。另外,我們集合網易公司的研發之力,和網易杭州研究院一起,攻克了數據處理、大規??蚣?、模型優化、領域適配等技術難題,開發了一些我們特有的技術,比如我們自己的領域適配技術,使得我們的模型能夠自動識別不同場景。目前已經在新聞、學習、口語和一些科技領域等場景下做到了最優。”

            我們做的神經網絡翻譯技術,目前可以很便捷讓用戶體驗到。比如用我們的翻譯引擎來做文本翻譯,翻譯效果比以前有了很大的提升;有道翻譯官的拍照翻譯,用戶只需要對文本進行拍照,就可實時展現出神經網絡翻譯的結果。另外,我們人工翻譯的團隊也開始全面使用有道上線的神經網絡翻譯技術,推出了“有道人機翻譯”服務:客戶提交訂單后,神經網絡翻譯模型會先做一版初步翻譯,譯員們再在這個基礎上進一步調整,這就很大地提高了翻譯效率,同時翻譯費用降低了50%。

            

            有道翻譯官拍照翻譯中的應用

            機器翻譯的未來 打破語言障礙

            回到問題的最初,我們為什么要投入這么巨大的人力物力財力,研究神經網絡機器翻譯呢?

            最直接和現實的價值就是,神經網絡翻譯能夠幫助人打破語言的障礙,使得信息的流通更加通常??v觀歷史,信息交流的變革都是對人類技術進步有很強的刺激作用,往遠看有印刷術、造紙術,近代有無線和有線電報等,以及到今天互聯網。雖然目前來看,信息技術的發展使得數據傳輸不再是瓶頸,但是另一個面臨的問題就是語言的障礙,比如數據傳過來沒有問題,但能不能看懂和理解就是另外回事。那么神經網絡翻譯能夠幫助人們打破這個障礙,使人的交流更加通常,這個意義是非常重大的。

            同時,神經網絡翻譯對整個人工智能領域有明顯的促進作用。語言和文字體系是人類特有的特性,所以如果我們沒有真正的理解語言的機制,那么就不可能說我們真正理解和做到人工智能。而在神經網絡翻譯的研究過程中,既包括了對語言的理解,也包括了語言的生成,所以對它的研究能夠很好地促進人工智能整體發展。

            也正因為如此,有道以及網易公司將以神經網絡翻譯技術為契機,進一步探索人工智能與機器翻譯的結合,推動行業的技術創新和發展。

          來源:中國網 責任編輯:陽光 我要投稿
          校體購終極頁

          相關閱讀

          版權與免責聲明:

          ① 凡本網注明"來源:教育裝備采購網"的所有作品,版權均屬于教育裝備采購網,未經本網授權不得轉載、摘編或利用其它方式使用。已獲本網授權的作品,應在授權范圍內使用,并注明"來源:教育裝備采購網"。違者本網將追究相關法律責任。

          ② 本網凡注明"來源:XXX(非本網)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,且不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、網站或個人從本網下載使用,必須保留本網注明的"稿件來源",并自負版權等法律責任。

          ③ 如涉及作品內容、版權等問題,請在作品發表之日起兩周內與本網聯系,否則視為放棄相關權利。

          校體購產品
          99久久国产自偷自偷免费一区|91久久精品无码一区|国语自产精品视频在线区|伊人久久大香线蕉av综合

            <acronym id="pokdi"><strong id="pokdi"></strong></acronym>
              <acronym id="pokdi"><label id="pokdi"><xmp id="pokdi"></xmp></label></acronym>

              <td id="pokdi"><ruby id="pokdi"></ruby></td>
              <td id="pokdi"><option id="pokdi"></option></td>
              <td id="pokdi"></td>