恰在此時,尹芙·卡莉向林灰建議要林灰再找一個翻譯,這樣就可以直接同聲傳譯了。
所謂的同聲傳譯,是指翻譯人員在不打斷交流者談話的時候進行翻譯同傳工作,這樣能使交流的效率大大提高。
不得不說,這樣的建議確實不錯。
不然的話即便米娜·卡莉能夠勝任翻譯工作。
林灰和尹芙間隔交流的話溝通效率也不會很高。
不過林灰該去哪找個翻譯呢?
而且是需要既有計算機背景又能勝任翻譯工作的人。
林灰一下子就想到了黃靜。
林灰記得黃靜可是南加大的碩士。
這樣的學位充當一下計算機方面的翻譯似乎問題不大。
林灰透過電話試探地詢問了黃靜的意見。
黃靜等待林灰的召喚似乎等了很久了。
根本沒等林灰細說。
幾乎不假思索就答應了林灰的請求。
……
尹芙·卡莉和米娜·卡莉在酒店安頓下來之後。
大概23號下午三點左右。
四人展開了學術上的討論。
當然主要是林灰和尹芙·卡莉進行討論。
這次的討論的性質有點類似於一個小型的座談會或者說一次頭腦風暴。
這次見面的地點並不是在公開場合,而是在狀元學府1號樓的601。
這個地方是前不久林灰在表彰大會上獲獎的那套商品房。
在表彰大會上獲得的150萬現金。
林灰沒有留著,直接給父母了,當然這筆錢給父母的過程林灰可是很費了一番周折的。
這套房子林灰原本也打算讓給父母的,不過林父林母拒絕了。
林灰家裡也不算缺房子住。
林灰也沒堅持,這套房子索性他自己就留著了。
說起來林灰還是第一次來這個地方。
一百三十多平的帶裝房。
這年頭房子基本都差不多,佈局什麼的照往後幾年的還差點。
當然了,林灰是作為獎品獲得的這套房子。
他似乎還沒有挑挑揀揀的餘地。
狀元學府這邊地方還不錯。
在北域城西這邊的老城,雖然離三小在內的周邊的學校都不遠。
但此處鬧中取靜,別有一番風味。
距離此處不遠是一個新落成的人工湖。
風景還算不錯。
環境相對來說也比較安靜。
正是因為這些原因,林灰才將這個地方選擇作為洽談地點。
環境安靜的話比較有利於深度思考。
談論開始了,尹芙·卡莉先是跟林灰介紹了她在研究中遇到的諸多難處。
事實上這些東西林灰記得尹芙·卡莉在先前發來的郵件中就已經闡述過了。
只不過現在闡述地更加詳細了。
林灰耐心地聽著。
林先前擔心地似乎有點多餘。
米娜·卡莉雖然不是從事過相關專業的。
但到底是姐妹情深,尹芙·卡莉在表述的時候都是用儘可能通俗易懂的語言。
儘量照顧著米娜的感受。
甚至有些時候林灰都能直接聽懂尹芙·卡莉所表達的內容。
儘管如此,林灰依然沒丟掉翻譯(黃靜)跟尹芙·卡莉溝通。
有些大牛明明自己會英文。
為什麼涉及到一些重要場合仍然要帶翻譯呢?
翻譯不完全是為了翻譯本身。
更多是為了一定的容錯性。
雖然涉及到文字摘要這種東西林灰都是相當熟悉不過的,很少出現錯誤。
但畢竟兩個時空是有些區別的。
林灰不小心表暴露了什麼豈不尷尬。
在常人面前如果林灰不小心暴露了什麼專業上的馬腳可能很難被發現。
如果是直接同尹芙·卡莉交流的話。
面對著一個同行直接交談的話,林灰並不能保證不會露出馬腳。
有翻譯在的話,多多少少多了一層緩衝。
儘管如此,林灰說話依舊要慎之又慎。
尹芙·卡莉向林灰著重介紹了這個時空裡人們是如何評估文字相似度的。
按照尹芙卡莉的表述,林灰才知道。
原來此時這個時空的人們主要是利用基於知識庫的方法來計算語義文字相似度的。
【目前用下來,聽書聲音最全最好用的App,集成4大語音合成引擎,超100種音色,更是支持離線朗讀的換源神器,huanyuanapp.org 換源App】
不過這個時空人們主要是利用基於網路知識的方法來計算的。
林灰知道這種方法的。
這類方法是基於知識庫計算相似度的一種。
這種方法主要利用網絡大型知識庫資源,如Wiki百科和擺渡百科等。
透過網頁內容和網頁間的超鏈接進行相似度計算。
隨著網際網路的快速發展,網路知識愈加豐富。
能夠充分利用網絡中的資源進行語義文字相似度計算自然是一個不錯的思路。
不過基於知識庫的方法來計算語義文字相似度可不只是這一種方法。
據林灰所知基於知識庫的語義文字相似度計算方法根據知識庫的型別其實是可以分為兩大類。
除了基於網路知識方法的話。
還有一類是基於本體的方法。
這類方法運用結構化語義詞典進行計算。
其基本思想就是運用這些語義詞典中包含的概念資訊和概念間的層次關係進行語義文字相似度計算。
按理說既然想到了基於知識庫的語義文字相似度計算方法的話應該首先想到基於本體的相似度計算方法才對才對啊。
為什麼沒先想到基於本體的方法?
反而先想到了基於網路知識的方法?
回想起尹芙先前的自我介紹,林灰恍然大悟。
尹芙的團隊沒想到這種方法也可以理解。
畢竟尹芙他們的團隊原本是和谷/歌方面深度合作的。
基於網路知識的方法利用網頁內容和超鏈接相似度進行計算的話雖然不容易。
但谷/歌的老本行PageRank演算法引入到NLP領域後實現的功能本就跟這個差不多。
這樣看來,和谷/歌方面的團隊有過深度合作關係的尹芙團隊忽視基於本體的方法而直接選擇基於網路知識的方法也是可以理解的。
說起來基於網路知識方法計算相似度實現起來並不容易。
畢竟網頁中知識顆粒度較粗。
說白了就是網頁中有用的東西少。
加之部分網頁的知識結構化程度較低。
如果直接對所有的網頁連結進行分析,會導致知識含量稀疏、計算困難等問題。
因此必須找網頁結構高同時知識內容集中的網頁才適合開發基於網路知識評估文字相似度的方法。
什麼樣的網頁具有這一特徵呢?
Wiki百科和擺渡百科。