隸屬于字節跳動公司,基于數據挖掘的推薦引擎產品,開放性內容創作與分發平臺,以個性化推薦著稱的聚合類資訊應用
今日(ri)頭條是北京字節跳(tiao)動(dong)科技有限(xian)公司開(kai)發的(de)一款基于數據挖掘(jue)的(de)引(yin)擎產品,為用戶信息(xi),提(ti)供連接人與信息(xi)的(de)服務的(de)產品。由張一鳴于2012年3月創(chuang)建,2012年8月發布(bu)版本。
基于個(ge)性(xing)化引擎技術,根據每個(ge)用戶的(de)興(xing)趣、位(wei)置等多(duo)個(ge)維(wei)度(du)進行(xing)個(ge)性(xing)化,內容不僅包(bao)括狹義(yi)上的(de)新聞,還包(bao)括音樂、電影、游戲(xi)、購物等資訊。
根據其(qi)社交行(xing)(xing)為(wei)、閱(yue)讀行(xing)(xing)為(wei)、地理位置、職業、年(nian)齡等挖掘(jue)出(chu)興趣(qu)。通過社交行(xing)(xing)為(wei)分(fen)析(xi),5秒(miao)鐘計算(suan)出(chu)用(yong)戶興趣(qu);通過用(yong)戶行(xing)(xing)為(wei)分(fen)析(xi),用(yong)戶每(mei)次動作后,10秒(miao)內更新用(yong)戶模(mo)型。
對每條信息(xi)提取幾十個(ge)到幾百個(ge)高維(wei)特征,并(bing)進行(xing)(xing)降(jiang)維(wei)、相似計算、聚類(lei)等計算去除重復信息(xi);對信息(xi)進行(xing)(xing)機器分(fen)類(lei)、摘要抽取,LDA主題分(fen)析、信息(xi)質量(liang)識別等處理。
根據人的特征、環境特征、文(wen)章(zhang)特征三(san)者的匹(pi)配(pei)程度進行。0.1秒(miao)內(nei)計(ji)(ji)算(suan)結果(guo),3秒(miao)完成文(wen)章(zhang)提取、挖掘(jue)、消重(zhong)、分類,5秒(miao)計(ji)(ji)算(suan)出新(xin)用(yong)(yong)戶興趣分配(pei),10秒(miao)內(nei)更新(xin)用(yong)(yong)戶模型。