一、商務(wù)智能(BI),商業(yè)智慧(BI)的發(fā)展方向:
BI新走向之一:融合加強,演變成門戶化
BI新走向之二:日趨“傻瓜”,體現(xiàn)人性化
BI新走向之三:移動BI將成為新戰(zhàn)場
BI新走向之四:在云中部署B(yǎng)I,成為主流方向
BI新走向之五:SaaSBI日漸雄起,受中小企業(yè)青睞
BI新走向之六:可視化技術(shù)呈亮點,交互式分析助推BI
BI新走向之七:外部信息將整合到內(nèi)部BI中,內(nèi)外網(wǎng)信息并聯(lián)互動
二、智能的搜索引擎研究方向:
查詢聚類(Query clustering)
查詢意圖識別(Query intent recognition)
查詢推薦(Query suggestion)
查詢改寫(Query rewriting),具體包括:
查詢同義變換(Query paraphrasing)
查詢擴展(Query expansion)
查詢縮略(Query reduction)
查詢糾錯(Query error correction)
學(xué)習(xí)排序(Learning to rank)
個性化搜索(Personalized search)
命名實體挖掘(Named entity mining)
本體知識庫構(gòu)建(Ontology construction)
三、商務(wù)智能(BI),人工智能(AI)的研究方向:
1.基于大規(guī)模機器學(xué)習(xí)的排序算法(Machine Learning to Rank)
排序算法是搜索技術(shù)的核心之一,基于機器學(xué)習(xí)排序算法將機器學(xué)習(xí)技術(shù)應(yīng)用于排序問題。研究內(nèi)容包括但不限于:
排序算法的分布式訓(xùn)練;
排序算法的在線學(xué)習(xí)(online learning);
排序算法的在線預(yù)測速度提升;
多目標(biāo)優(yōu)化的排序算法。
2.海量特征設(shè)計(large scale feature engineering)
特征設(shè)計在機器學(xué)習(xí)系統(tǒng)中扮演著至關(guān)重要的作用。但當(dāng)面臨海量數(shù)據(jù)時,往往特征數(shù)量也會是海量的,這時如何做好特征選擇、特征組合等工作,與小規(guī)模時相比會復(fù)雜很多。研究內(nèi)容包括但不限于:
海量特征自動選擇;
海量特征自動組合。
3.高效訓(xùn)練樣本獲取(Label Complexity Reduction)
機器學(xué)習(xí)算法要求大量的高質(zhì)量的標(biāo)注樣本,然而標(biāo)注樣本耗時耗力,并且在樣本到達(dá)一定量后,對樣本量的需求增幅遠(yuǎn)大于訓(xùn)練效果提升,如何高效地獲取良好樣本是一個挑戰(zhàn)。海量互聯(lián)網(wǎng)數(shù)據(jù)下的LTR的樣本獲取、多語言學(xué)習(xí)任務(wù)背景下標(biāo)注樣本的獲取、網(wǎng)頁/網(wǎng)站/query等的分類或聚類所需樣本等是高效樣本獲取方法的應(yīng)用場景。本方向的問題包括但不限于:
通過主動學(xué)習(xí)(Active learning)加速標(biāo)注流程。
通過遷移學(xué)習(xí)/多任務(wù)學(xué)習(xí)(Transfer learning/multi-task learning) 利用其他領(lǐng)域的知識和標(biāo)注樣本來提升另一領(lǐng)域的學(xué)習(xí)效果。
通過半監(jiān)督學(xué)習(xí)(Semi-supervised learning),考慮如何利用少量的標(biāo)注樣本和大量的未標(biāo)注樣本進(jìn)行分類和聚類,相關(guān)問題有半監(jiān)督學(xué)習(xí)的算法改進(jìn)、半監(jiān)督學(xué)習(xí)的在線學(xué)習(xí)(Online-learning)或者增量學(xué)習(xí)(incremental-learning)算法等。
4.規(guī)則系統(tǒng)與機器學(xué)習(xí)系統(tǒng)的整合 (Integration of rule-based system and learning-based system)
規(guī)則系統(tǒng)和學(xué)習(xí)系統(tǒng)一直是人工智能實現(xiàn)方法的兩個分支,二者各有優(yōu)劣。規(guī)則系統(tǒng)更擅長高頻和訓(xùn)練數(shù)據(jù)稀疏部分,而學(xué)習(xí)系統(tǒng)的泛化能力更出色。如何結(jié)合兩者的優(yōu)勢,規(guī)避各自的缺點,是我們希望探討的地方。研究內(nèi)容只要與兩個系統(tǒng)的整合相關(guān)即可。
5.海量數(shù)據(jù)的主題模型(Topic-model on large scale data)
主題模型主要使用大規(guī)模的文檔—詞匯共現(xiàn)(co-occurrence) 矩陣,例如1億*100萬的矩陣來建模文檔和詞匯間的潛在聯(lián)系。研究內(nèi)容包括但不限于:
主題模型的建模改進(jìn);
主題模型的在線學(xué)習(xí)(Online learning)或者增量學(xué)習(xí)(incremental learning);
主題模型訓(xùn)練過程的大規(guī)模并行優(yōu)化;
主題模型的應(yīng)用。
6.推薦系統(tǒng)(recommender system)
推薦系統(tǒng)有著廣泛的應(yīng)用,如搜索引擎和電子商務(wù)網(wǎng)站以各種方式使用著推薦系統(tǒng)。在百度的應(yīng)用即包括在搜索、知道、音樂、貼吧等用戶產(chǎn)品內(nèi)及產(chǎn)品間的推薦,也包括面向搜索請求推薦廣告、面向廣告商推薦關(guān)鍵詞等。不同應(yīng)用場景的應(yīng)用目標(biāo)和數(shù)據(jù)量存在較大差異,對于推薦算法本身也存在不同要求。在本領(lǐng)域的研究包括但不限于:
推薦系統(tǒng)的設(shè)計;
推薦算法的改進(jìn);
推薦效果的評估;
個性化推薦。
7.點擊模型(Click Model)
百度擁有中國搜索引擎市場上最豐富的用戶數(shù)據(jù),點擊模型將極大提升用戶對搜索的需求滿意度。研究內(nèi)容包括但不限于:
用戶行為數(shù)據(jù)清洗;
用戶行為分析和建模;
用戶行為用于評測。
8.網(wǎng)頁多分類學(xué)習(xí)
互聯(lián)網(wǎng)中網(wǎng)頁資源可以按照不同的維度劃分成不同的類型,而且一個網(wǎng)頁可能兼有多個維度的類型標(biāo)記。該方向的主要目標(biāo)就是:如何自動高效地為網(wǎng)頁進(jìn)行分類標(biāo)記。研究內(nèi)容包括但不限于:
網(wǎng)頁分類的機器學(xué)習(xí)模型研究:二分類/多分類/多標(biāo)記學(xué)習(xí)/無監(jiān)督學(xué)習(xí)等;
主題/資源/結(jié)構(gòu)分類特征挖掘;
模型的跨語言通用性研究。
9.基于海量網(wǎng)頁的結(jié)構(gòu)化信息自動抽取研究
WEB結(jié)構(gòu)化信息抽取就是將網(wǎng)頁中的非結(jié)構(gòu)化數(shù)據(jù)按照一定的需求抽取轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。研究內(nèi)容包括但不限于:
結(jié)構(gòu)化信息自動抽取方法改進(jìn);
抽取規(guī)則生成表示優(yōu)化。
10.觀點挖掘、情感分析(opinion mining and sentiment analysis)
觀點挖掘、情感分析主要是對帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程。研究內(nèi)容包括但不限于:
情感分析的算法改進(jìn);
情感分析在大規(guī)模數(shù)據(jù)(博客、微博、新聞評論、商品評論)中的應(yīng)用;
情感分析在推薦中的應(yīng)用。
11.基于機器學(xué)習(xí)的反作弊研究(fraud detection based on machine learning)
基于機器學(xué)習(xí)的反作弊研究內(nèi)容包括但不限于:
自動訓(xùn)練數(shù)據(jù)標(biāo)注;
作弊特征分析;
在線實時作弊檢測;
離線批量數(shù)據(jù)評估。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:商務(wù)智能的發(fā)展——未來的研究方向