18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌翻譯竟然預(yù)言世界末日?

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-23 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“世界末日時(shí)鐘是23點(diǎn)57分。我們正在經(jīng)歷世界上的戲劇性的發(fā)展,這表明我們?cè)絹?lái)越接近末日和耶穌的回歸?!边@段驚悚的“預(yù)言”來(lái)自谷歌翻譯。2016年,谷歌宣布機(jī)器翻譯“重大突破”——神經(jīng)機(jī)器翻譯(GNMT),將翻譯質(zhì)量提高到接近人類筆譯的水平。然而,它將無(wú)意義的文本翻譯成怪異的宗教預(yù)言引起了新的恐慌。這次,要怪AI是“黑盒”,還是拖出谷歌員工來(lái)背鍋?

在Google Translate中鍵入“dog”一詞19次,然后選擇將這段無(wú)意義的文本從毛利語(yǔ)翻譯成英語(yǔ),結(jié)果會(huì)怎樣?

彈出來(lái)的是一段看似亂碼宗教預(yù)言:

Doomsday Clock is three minutes at twelve We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return.

“世界末日時(shí)鐘還差3分鐘到12點(diǎn)。我們正在經(jīng)歷世界上的人物和戲劇性的發(fā)展,這表明我們?cè)絹?lái)越接近末日和耶穌的回歸?!?/p>

這只是Reddit以及其他網(wǎng)站用戶從谷歌翻譯中挖掘出來(lái)的眾多怪異、有時(shí)甚至是不祥的翻譯的一個(gè)例子。將原文設(shè)為索馬里語(yǔ),連續(xù)輸入“ag”一詞,這個(gè)字符串會(huì)被翻譯成“sons of Gershon”(革順的兒子),“name of the LORD”(上帝的名字),并且會(huì)引用圣經(jīng)里的術(shù)語(yǔ),例如“cubits”(肘,圣經(jīng)中的度量衡)和Deuteronomy(《申命記》)。谷歌翻譯是谷歌已經(jīng)推出10年的服務(wù),現(xiàn)在可以翻譯超過(guò)100種語(yǔ)言。

在推特上,這些翻譯引起恐慌,有人甚至將這些奇怪的翻譯歸咎于鬼魂和惡魔。reddit上TranslateGate子論壇上有用戶推測(cè),其中一些奇怪的翻譯輸出可能來(lái)自收集自電子郵件或私人消息的文本。

谷歌發(fā)言人Justin Burr在一封電子郵件中表示:“Google Translate從網(wǎng)絡(luò)上的翻譯范例學(xué)習(xí),不使用‘私人信息’進(jìn)行翻譯,系統(tǒng)甚至都無(wú)法訪問(wèn)到這些內(nèi)容?!薄斑@只是將無(wú)意義的話語(yǔ)輸入系統(tǒng),導(dǎo)致產(chǎn)生的也是無(wú)意義的內(nèi)容的一種功能?!?/p>

對(duì)于這種怪異的輸出,有幾種可能的解釋。比如,這些惡意消息可能是心懷不滿的谷歌員工造成的,也可能是惡作劇用戶濫用“提供建議”按鈕造成的,該選項(xiàng)將接受用戶提供的有助于改善翻譯質(zhì)量的建議。

罪魁禍?zhǔn)卓赡苁巧窠?jīng)機(jī)器翻譯

哈佛大學(xué)研究自然語(yǔ)言處理和計(jì)算機(jī)翻譯的助理教授Andrew Rush認(rèn)為,內(nèi)部的質(zhì)量過(guò)濾器(quality filter)可能會(huì)捕捉到這種類型的惡意操作。Rush說(shuō),更有可能的是,這些奇怪的翻譯與2016年時(shí)谷歌翻譯的一個(gè)重大變化有關(guān)——它開(kāi)始使用一種叫做“神經(jīng)機(jī)器翻譯”的技術(shù)。

在神經(jīng)機(jī)器翻譯中,使用一種語(yǔ)言的大量文本和另一種語(yǔ)言的相應(yīng)譯文來(lái)訓(xùn)練系統(tǒng),以創(chuàng)建一個(gè)能夠在兩種語(yǔ)言之間相互翻譯的模型。Rush說(shuō),當(dāng)系統(tǒng)被輸入無(wú)意義的文本時(shí),它就會(huì)“產(chǎn)生幻覺(jué)”,生成怪異的輸出——就像谷歌的DeepDream視覺(jué)系統(tǒng)會(huì)產(chǎn)生可怕的圖像一樣。

谷歌DeepDream的作畫(huà)

“這些模型都是黑盒,你能找到多少訓(xùn)練實(shí)例,它就能學(xué)到多少?!?Rush說(shuō):“訓(xùn)練實(shí)例中絕大部分看起來(lái)都像人類語(yǔ)言,因此當(dāng)你給它一個(gè)新的實(shí)例時(shí),它受到的訓(xùn)練就是,不惜一切代價(jià)創(chuàng)造出一些看起來(lái)也像人類語(yǔ)言的東西。然而,如果你給它一些非常不同的東西,最好的翻譯將是一些看起來(lái)仍然流暢的文本,但根本與輸入無(wú)關(guān)。”

BBN Technologies的資深科學(xué)家、從事機(jī)器翻譯工作的Sean Colbath也同意,奇怪的輸出可能是由于Google Translate的算法試圖在混亂中尋找秩序。他還指出,這些產(chǎn)生最奇怪結(jié)果的語(yǔ)言——索馬里語(yǔ)、夏威夷語(yǔ)和毛利語(yǔ)——它們用于訓(xùn)練的翻譯文本比英語(yǔ)或漢語(yǔ)等更廣泛使用的語(yǔ)言要小得多。因此,Colbath說(shuō),谷歌可能會(huì)使用《圣經(jīng)》這類的宗教文本(《圣經(jīng)》已經(jīng)被翻譯成多種語(yǔ)言),用這些文本來(lái)訓(xùn)練它的模型,導(dǎo)致產(chǎn)生宗教內(nèi)容。

Rush也同意這種說(shuō)法,如果谷歌使用《圣經(jīng)》來(lái)訓(xùn)練它的神經(jīng)翻譯模型,那么就可以解釋一些奇怪的輸出了。事實(shí)上,索馬里語(yǔ)的幾個(gè)奇怪的翻譯版本與《舊約》中的某些章節(jié)很相似。比如《出埃及記》27:18提到“a hundred cubits”(長(zhǎng)一 百肘),并且有幾節(jié)經(jīng)文,包括《民數(shù)記》3:18討論了“sons of Gershon”(革順的兒子)。

谷歌發(fā)言人Justin Burr拒絕回答Google Translate的訓(xùn)練數(shù)據(jù)是否包含宗教文本。

但有時(shí)候,確實(shí)感覺(jué)這個(gè)算法似乎在傳遞某種神秘的精神能量——它甚至?xí)_(kāi)笑話。

你看,用Google Translate翻譯“w hy ar e th e tran stla tions so wei rd”在索馬里語(yǔ)中的意思,它的輸出是,“這是一個(gè)讓它變得更好的好辦法”。

神經(jīng)機(jī)器翻譯的主要問(wèn)題

Philipp Koehn和Rebecca Knowles在2017年就這一主題撰寫(xiě)了一篇精彩的關(guān)于神經(jīng)機(jī)器翻譯的論文(文末附論文地址),現(xiàn)在仍然具有現(xiàn)實(shí)意義。在這里有必要總結(jié)一下:

1.神經(jīng)機(jī)器翻譯(NMT)在處理領(lǐng)域之外的數(shù)據(jù)時(shí)的表現(xiàn)很糟:當(dāng)前的機(jī)器翻譯系統(tǒng)會(huì)生成非常流暢的輸出,這些輸出與領(lǐng)域外數(shù)據(jù)的輸入無(wú)關(guān)。因此像Google翻譯這樣的通用機(jī)器翻譯系統(tǒng)在法律或金融等專業(yè)領(lǐng)域的表現(xiàn)尤其糟糕。與基于短語(yǔ)的系統(tǒng)等傳統(tǒng)方法相比,NMT系統(tǒng)的效果更差。有多差呢?請(qǐng)參閱下面的圖表。非對(duì)角線上元素是是用領(lǐng)域外數(shù)據(jù)訓(xùn)練后的結(jié)果,綠色條代表NMT,藍(lán)色條代表基于短語(yǔ)的系統(tǒng)。

將機(jī)器翻譯系統(tǒng)在一個(gè)領(lǐng)域內(nèi)(行)上訓(xùn)練,并在另一個(gè)領(lǐng)域(列)上進(jìn)行測(cè)試。

藍(lán)色:基于短語(yǔ)的系統(tǒng) 綠色:NMT

2.NMT在小數(shù)據(jù)集上表現(xiàn)不佳:一般而言,大多數(shù)機(jī)器學(xué)習(xí)都是這樣,但這個(gè)問(wèn)題在NMT上尤為突出。 NMT的優(yōu)點(diǎn)在于,隨著數(shù)據(jù)量的增加,它的表現(xiàn)要(比基于短語(yǔ)的機(jī)器翻譯)更好,但在數(shù)據(jù)量很低的情況下,NMT的表現(xiàn)確實(shí)更差。事實(shí)上,正如作者所說(shuō),“在資源條件較差的情況下,NMT會(huì)產(chǎn)生與輸入內(nèi)容無(wú)關(guān)的流暢輸出。”這可能是Motherboard的文章探討的一些關(guān)于NMT表現(xiàn)奇怪的另一個(gè)原因。

3.NMT在罕見(jiàn)詞匯上的表現(xiàn)不佳:盡管比基于短語(yǔ)的翻譯的表現(xiàn)更好,但NMT對(duì)于罕見(jiàn)或未見(jiàn)過(guò)的詞語(yǔ)翻譯的表現(xiàn)不佳。對(duì)于存在大量變形詞的語(yǔ)言及大量命名實(shí)體的領(lǐng)域,這可能成為一個(gè)問(wèn)題,因?yàn)樽冃卧~和命名實(shí)體一般非常罕見(jiàn)。

上圖是我們即將出版的書(shū)的第2章部分內(nèi)容的摘錄。例如,在土耳其語(yǔ)中,時(shí)不時(shí)就會(huì)遇到變形形式的詞。

如果單詞只被觀察到一次,就會(huì)被舍棄。字節(jié)成對(duì)編碼(byte-pair encoding)技術(shù)有助于解決這個(gè)問(wèn)題,但有必要對(duì)此進(jìn)行更詳細(xì)的研究。

4.長(zhǎng)句的翻譯問(wèn)題:對(duì)長(zhǎng)句編碼及生成長(zhǎng)句仍然是一個(gè)沒(méi)有解決的問(wèn)題。 機(jī)器翻譯系統(tǒng)隨句子長(zhǎng)度的增加,其表現(xiàn)會(huì)越來(lái)越糟,NMT系統(tǒng)尤其如此。使用注意力有幫助,但問(wèn)題遠(yuǎn)未“解決”。在許多領(lǐng)域,如法律領(lǐng)域,冗長(zhǎng)復(fù)雜的句子是很常見(jiàn)的。

5.注意力(Attention)機(jī)制不等于簡(jiǎn)單對(duì)齊:這是一個(gè)非常微妙但重要的問(wèn)題。在傳統(tǒng)的SMT系統(tǒng)(如基于短語(yǔ)的MT)中,對(duì)齊翻譯為模型的檢測(cè)提供了有用的調(diào)試信息。但是注意機(jī)制不能被視為傳統(tǒng)意義上的對(duì)齊,即使論文經(jīng)常將注意力機(jī)制作為“軟對(duì)齊”引起注意。在NMT系統(tǒng)中,除了源語(yǔ)言中的動(dòng)詞之外,目標(biāo)語(yǔ)言中的動(dòng)詞也可以作為主語(yǔ)和賓語(yǔ)成分。

6.難以控制翻譯質(zhì)量:每個(gè)單詞都有多種翻譯,典型的機(jī)器翻譯系統(tǒng)在源句的翻譯結(jié)構(gòu)上表現(xiàn)很好。為了保持句子結(jié)構(gòu)的大小合理,會(huì)使用集束搜索(beam search)。通過(guò)改變集束寬度,可以找到低概率但正確的平移。而對(duì)于NMT系統(tǒng),調(diào)整集束的寬度似乎沒(méi)有任何影響,甚至可能會(huì)有不良影響。

當(dāng)數(shù)據(jù)量很大時(shí),NMT系統(tǒng)仍然很難被擊敗。關(guān)于神經(jīng)網(wǎng)絡(luò)模型的黑盒性的討論也在繼續(xù),今天的NMT模型(不論是基于LSTM還是Transformer)都會(huì)受此影響。這是一個(gè)活躍的研究領(lǐng)域,如果時(shí)間允許,我期待參加EMNLP關(guān)于該主題的研討會(huì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6241

    瀏覽量

    109968
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    15412

原文標(biāo)題:谷歌翻譯竟預(yù)言世界末日,專家解密神經(jīng)翻譯6大難題

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    亮亮視野AR翻譯眼鏡亮相HICOOL 2025全球創(chuàng)業(yè)者峰會(huì)

    、IASP世界大會(huì)和京臺(tái)科技論壇獨(dú)家提供AR翻譯技術(shù)服務(wù)之后,亮亮視野再次亮相大型國(guó)際論壇,旗下AR翻譯眼鏡逐漸成為北京文化科技新符號(hào),也是北京打造“全球創(chuàng)新創(chuàng)業(yè)生態(tài)之都”的最新實(shí)例。
    的頭像 發(fā)表于 10-23 17:34 ?314次閱讀

    AI Agent 顛覆連鎖門(mén)店管理?華為《智能世界 2035》重磅預(yù)言

    ...... 整個(gè)世界仿佛擁有一個(gè)共同的智能大腦,AI Agent 不只是工具,更是企業(yè)與行業(yè)的自主協(xié)同超級(jí)節(jié)點(diǎn)。 上述正是華為《智能世界 2035》報(bào)告描繪的藍(lán)圖: 在十大技術(shù)躍遷的推動(dòng)下,制造、能源、商業(yè)服務(wù)、醫(yī)療、教育等多個(gè)行業(yè)正在飛速進(jìn)行 A
    的頭像 發(fā)表于 10-11 16:47 ?397次閱讀
    AI Agent 顛覆連鎖門(mén)店管理?華為《智能<b class='flag-5'>世界</b> 2035》重磅<b class='flag-5'>預(yù)言</b>!

    亮亮視野AR翻譯眼鏡亮相2025北京文化論壇

    世界大會(huì)和京臺(tái)科技論壇獨(dú)家提供AR翻譯技術(shù)服務(wù)之后,亮亮視野再次服務(wù)大型國(guó)際論壇,旗下AR翻譯眼鏡也正逐漸成為北京文化科技新符號(hào)。
    的頭像 發(fā)表于 09-30 11:14 ?663次閱讀

    工業(yè)網(wǎng)關(guān):連接工業(yè)現(xiàn)場(chǎng)與數(shù)字世界的“翻譯官”

    。這時(shí),工業(yè)網(wǎng)關(guān)就登場(chǎng)了,它就像一個(gè)專業(yè)的“翻譯官”,不僅能讓這些設(shè)備“開(kāi)口說(shuō)話”,還能把它們的數(shù)據(jù)安全、高效地傳送到更遠(yuǎn)的地方,甚至云端。那么,工業(yè)網(wǎng)關(guān)到底能用在哪些場(chǎng)景上呢?今天咱們就來(lái)好好聊聊。
    的頭像 發(fā)表于 09-24 14:45 ?335次閱讀
    工業(yè)網(wǎng)關(guān):連接工業(yè)現(xiàn)場(chǎng)與數(shù)字<b class='flag-5'>世界</b>的“<b class='flag-5'>翻譯</b>官”

    成都京東方醫(yī)院完成世界首例反向折疊脊柱畸形手術(shù)

    近日,成都京東方醫(yī)院成功完成世界首例反向折疊脊柱畸形矯正手術(shù),為一名曾被預(yù)言“活不過(guò)13歲”的極重度脊柱畸形患者帶來(lái)新生。
    的頭像 發(fā)表于 09-18 15:48 ?330次閱讀

    當(dāng)翻譯失去網(wǎng)絡(luò),時(shí)空壺新T1翻譯機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    在全球化交流日益緊密的當(dāng)下,跨語(yǔ)言溝通工具的重要性愈發(fā)凸顯。近日,時(shí)空壺推出的T1翻譯機(jī)憑借其強(qiáng)大的離線模型與便捷應(yīng)用,成為市場(chǎng)焦點(diǎn),為人們?cè)诳鐕?guó)交流場(chǎng)景中帶來(lái)前所未有的便利。時(shí)空壺T1翻譯機(jī)搭載了
    的頭像 發(fā)表于 09-08 16:52 ?770次閱讀
    當(dāng)<b class='flag-5'>翻譯</b>失去網(wǎng)絡(luò),時(shí)空壺新T1<b class='flag-5'>翻譯</b>機(jī)開(kāi)創(chuàng)首個(gè)離線模型賦能全球溝通新體驗(yàn)

    聲智科技聲學(xué)模型賦予AI感知物理世界

    在科技浪潮的尖端,一個(gè)新時(shí)代正悄然開(kāi)啟。NVIDIA創(chuàng)始人黃仁勛曾預(yù)言,未來(lái)通用人工智能(AGI)將不再局限于虛擬世界,而是能夠與物理世界深度交互的“物理AI”。圖靈獎(jiǎng)得主楊立昆和計(jì)算機(jī)科學(xué)家李飛飛
    的頭像 發(fā)表于 09-02 17:46 ?874次閱讀

    谷歌DeepMind重磅發(fā)布Genie 3,首次實(shí)現(xiàn)世界模型實(shí)時(shí)交互

    電子發(fā)燒友網(wǎng)綜合報(bào)道 當(dāng)?shù)貢r(shí)間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達(dá)科學(xué)家Jim Fan譽(yù)為“游戲引擎2.0”的模型,通過(guò)單文本提示即可生成實(shí)時(shí)
    的頭像 發(fā)表于 08-13 08:27 ?6351次閱讀

    谷歌地圖GPS定位

    谷歌地圖GPS定位:精準(zhǔn)導(dǎo)航背后的技術(shù)解析 谷歌地圖作為全球最受歡迎的地圖服務(wù)之一,其精準(zhǔn)的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術(shù),實(shí)現(xiàn)高精度定位,并帶來(lái)革命性
    的頭像 發(fā)表于 05-29 16:54 ?660次閱讀

    UPS(不間斷電源)故障頻發(fā)?原因竟然是這樣

    UPS(不間斷電源)故障頻發(fā)?原因竟然是這樣
    的頭像 發(fā)表于 04-19 13:53 ?1071次閱讀
    UPS(不間斷電源)故障頻發(fā)?原因<b class='flag-5'>竟然</b>是這樣

    探索信號(hào)分析的奇妙世界

    在這個(gè)信息爆炸的時(shí)代無(wú)線通信已經(jīng)成為我們生活中不可或缺的一部分無(wú)論是手機(jī)、無(wú)線網(wǎng)絡(luò)還是衛(wèi)星通信背后都有一個(gè)共同的英雄——信號(hào)分析儀今天,就讓我們一起探索這個(gè)奇妙的無(wú)線電世界了解信號(hào)分析產(chǎn)品如何幫助
    的頭像 發(fā)表于 04-07 09:49 ?485次閱讀
    探索信號(hào)分析的奇妙<b class='flag-5'>世界</b>

    測(cè)量ADS1274的DOUT[5:8],竟然和地是通的,這是怎么回事?

    測(cè)量ADS1274的DOUT[5:8],竟然和地是通的,這是怎么回事? 是芯片的問(wèn)題?
    發(fā)表于 02-13 08:21

    AI助力實(shí)時(shí)翻譯耳機(jī)

    你是否曾經(jīng)因?yàn)檎Z(yǔ)言障礙而無(wú)法與外國(guó)人順暢交流?或者在旅行中因?yàn)檎Z(yǔ)言不通而錯(cuò)過(guò)了一些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術(shù)的發(fā)展,實(shí)時(shí)翻譯耳機(jī)可以幫你輕松解決這些問(wèn)題。 1 什么是實(shí)時(shí)翻譯耳機(jī) 實(shí)時(shí)翻譯耳機(jī)
    的頭像 發(fā)表于 01-24 11:14 ?2679次閱讀
    AI助力實(shí)時(shí)<b class='flag-5'>翻譯</b>耳機(jī)

    ADS8361輸入不接的時(shí)候,輸出端的時(shí)序竟然有波形出來(lái),是哪里的問(wèn)題?

    我現(xiàn)在在使用這款A(yù)DS8361采集芯片,請(qǐng)問(wèn),當(dāng)輸入不接的時(shí)候,輸出端的時(shí)序竟然有波形出來(lái),有6萬(wàn)多,我感覺(jué)是不是芯片有問(wèn)題?當(dāng)沒(méi)有輸入信號(hào),輸出端竟然有波形,而且還是一個(gè)很寬的高電平,但是每20個(gè)脈沖,輸出端波形一致,感覺(jué)是不是哪里出問(wèn)題了?請(qǐng)大牛解答下,謝謝!
    發(fā)表于 12-20 08:06

    LLMWorld上線代碼翻譯新工具——問(wèn)丫·碼語(yǔ)翻譯俠,快來(lái)體驗(yàn)!

    01. 工具介紹 aicode.llmworld.net 問(wèn)丫·碼語(yǔ)翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語(yǔ)言之間的翻譯,包括計(jì)算機(jī)語(yǔ)言到自然語(yǔ)言。 02.
    的頭像 發(fā)表于 12-09 11:11 ?1509次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問(wèn)丫·碼語(yǔ)<b class='flag-5'>翻譯</b>俠,快來(lái)體驗(yàn)!