人工智能首先改變的是搜索引擎

搜索引擎自己沒有數(shù)據(jù)、它通過在網(wǎng)絡(luò)上的服務(wù)器、交換機(jī)、路由器等能存儲(chǔ)和交換數(shù)據(jù)的介質(zhì)上采集數(shù)據(jù),并通過這些數(shù)據(jù)找到與其對(duì)應(yīng)的數(shù)據(jù)源,然后,以此數(shù)據(jù)源為始點(diǎn)獲得其他數(shù)據(jù)源,不斷采集相關(guān)數(shù)據(jù)進(jìn)行分析。這個(gè)過程會(huì)反復(fù)進(jìn)行、以實(shí)現(xiàn)對(duì)可能是一個(gè)詞、一個(gè)短語或一篇文章的單元數(shù)據(jù)進(jìn)行深度挖掘、在海量數(shù)據(jù)中查找此單元數(shù)據(jù)的相關(guān)性并賦予權(quán)重。在一篇文章中,每個(gè)被數(shù)據(jù)噪音后的詞匯、句子、以至于所有文章都會(huì)以單一數(shù)據(jù)的形式被權(quán)重賦值,通過多數(shù)據(jù)源以及其對(duì)應(yīng)的物理參數(shù)確定數(shù)據(jù)權(quán)重,數(shù)據(jù)權(quán)重是物理世界賦予的權(quán)重、因此權(quán)重越大的數(shù)據(jù)就越接近請(qǐng)求者所需要的答案,當(dāng)一個(gè)請(qǐng)求者在搜索框中輸入一個(gè)檢索內(nèi)容時(shí)、搜索引擎就以其被賦予的權(quán)重大小展示結(jié)果給信息請(qǐng)求者,搜索人通過搜索引擎提供的鏈接,一條一條的閱讀篩選符合自己要求的信息、產(chǎn)品或制造商等;

搜索引擎之所以被稱為引擎,是因?yàn)樗衿囈嬉粯樱瑸榫W(wǎng)絡(luò)中的數(shù)據(jù)提供流動(dòng)的動(dòng)力。搜索引擎通常有一個(gè)類似門一樣的搜索框,是人們進(jìn)入數(shù)據(jù)世界并使用數(shù)據(jù)的入口。因此,幾乎所有上網(wǎng)的人都會(huì)使用搜索引擎,至于選擇使用哪個(gè)搜索引擎,除了個(gè)人偏好以外,通常取決于搜索結(jié)果的真實(shí)可靠程度以及與搜索者預(yù)期答案的接近程度。優(yōu)秀的搜索引擎提供給人們真實(shí)有效的信息,這也是它們受歡迎的前提,而受歡迎、有人氣又是商業(yè)收益的前提。因此,任何優(yōu)秀的搜索引擎都會(huì)極力以搜索質(zhì)量競(jìng)爭為存在的前提,因此,反信息欺詐、凈化垃圾和重復(fù)信息等,是任何搜索引擎保證搜索質(zhì)量的前提。

搜索引擎沒有自己的數(shù)據(jù),它的數(shù)據(jù)庫中的數(shù)據(jù)是從網(wǎng)絡(luò)中采集的現(xiàn)有數(shù)據(jù)經(jīng)過切詞分析、權(quán)重配置等處理后形成的鏈接數(shù)據(jù)庫。搜索引擎的收益來自廣告收益。以谷歌為例,一般一個(gè)搜索字符串配有大約10個(gè)左右的廣告。隨著搜索詞條和不同國家、區(qū)域的變化,所配置的廣告也會(huì)相應(yīng)變化,也只有這樣才能更準(zhǔn)確地為搜索者提供更切實(shí)際的信息,以及配置更符合地域特點(diǎn)的商業(yè)廣告。

盡管像Google這樣優(yōu)秀的大型搜索公司已經(jīng)利用人工智能基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)對(duì)其數(shù)據(jù)庫中的所有被切分詞和多維重組數(shù)據(jù)進(jìn)行了排序權(quán)重配置,但它的搜索結(jié)果仍然只是第三方鏈接,而不是直接的答案。這就好比學(xué)生向老師詢問問題,但老師卻給了學(xué)生一本書讓他自己找答案,沒有直接滿足學(xué)生的需求。

ChatGPT的出現(xiàn),改變了搜索的現(xiàn)狀,ChatGPT目前正在嘗試運(yùn)行,并主要應(yīng)用于搜索領(lǐng)域,可它不再提供類似于包含答案的一本書的搜索結(jié)果,而是直接給出答案。與此同時(shí),其他正在商業(yè)化的人工智能搜索也不再是簡單地提供數(shù)百頁的鏈接,而是生成智能答案包括答案中所使用的數(shù)據(jù)源,雖然鏈接數(shù)量不多,但非常準(zhǔn)確,人工智能取代了人類對(duì)所有信息進(jìn)行篩選,最終將答案直接提供給搜索者。

ChatGPT使人們認(rèn)識(shí)到人工智能的發(fā)展方向,人工智能的發(fā)展也剛剛開始。隨著不同模型的開發(fā)應(yīng)用和算力的進(jìn)步,人工智能應(yīng)用將會(huì)被迅速普及。人工智能是利用網(wǎng)絡(luò)中現(xiàn)有的數(shù)據(jù)生成智能答案,每個(gè)參與答案數(shù)據(jù)的數(shù)據(jù)源都會(huì)被展示給搜索者。然而,人工智能需要海量數(shù)據(jù)支持,目前互聯(lián)網(wǎng)中特別是具有參數(shù)的工業(yè)產(chǎn)品數(shù)據(jù)嚴(yán)重不足。因此,企業(yè)需要積極參與數(shù)據(jù)的提供,數(shù)據(jù)將帶來巨大的收益!

2024-05-09