乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      一文即可明白什么是:用戶畫像、文章畫像與智能推送

       豫龍晏子 2017-09-11

      1.算法按照何種規(guī)則推送文章

      用戶對(duì)一篇文章的行為,包括:點(diǎn)擊數(shù)、分享數(shù)、評(píng)論數(shù)、收藏?cái)?shù)、用戶停留時(shí)長(zhǎng)等;而對(duì)公號(hào)來(lái)說(shuō),名是訂閱數(shù)以及訂閱后公號(hào)與讀者之間的黏度。

      一文即可明白什么是:用戶畫像、文章畫像與智能推送

      那么,誰(shuí)又有權(quán)力對(duì)內(nèi)容進(jìn)行分發(fā)?在傳統(tǒng)媒體時(shí)代,只有編輯擁有這種權(quán)力。比如,點(diǎn)擊數(shù)取決于文章的位置、曝光時(shí)長(zhǎng),也取決于標(biāo)題和配圖,這就是編輯的權(quán)力。而分享數(shù)取決于文章的質(zhì)量,評(píng)論數(shù)取決于能不能挑動(dòng)社會(huì)情緒,收藏?cái)?shù)取決于文章有沒(méi)有價(jià)值,用戶停留時(shí)長(zhǎng)取決于文章質(zhì)量。這些,都是要靠人來(lái)運(yùn)營(yíng)的。

      但在今天,由于社交媒體的興起,專業(yè)人士之外,社交媒體中的每一個(gè)人都有權(quán)力發(fā)言、轉(zhuǎn)發(fā);人工智能的應(yīng)用,則讓算法同樣具有了內(nèi)容分發(fā)的權(quán)力。

      因?yàn)橐稽c(diǎn)資訊是一個(gè)靠人工智能分發(fā)的App,我們就跳過(guò)社交,進(jìn)入算法是如何進(jìn)行內(nèi)容分發(fā)的環(huán)節(jié)。

      在這里,先要講個(gè)小故事,讓大家弄清楚幾個(gè)概念:人工智能、機(jī)器學(xué)習(xí),以及算法主導(dǎo)的內(nèi)容分發(fā)。

      這個(gè)故事,講述的是“我”是如何在老板的眼皮底下看日本AV動(dòng)作片的。

      圖說(shuō):有誰(shuí)認(rèn)識(shí)這位同學(xué),請(qǐng)舉手!

      我的工位就在老板辦公室附近,每次他出門都要經(jīng)過(guò)??晌曳浅O朐谏习鄷r(shí)間看日本動(dòng)作片。于是,我首先要安裝一個(gè)攝像頭,攝像頭對(duì)著他辦公室大門。只要他一出辦公室門,攝像頭能就拍下他,然后傳輸?shù)轿业碾娔X上。我在電腦上放了“一點(diǎn)資訊算法分發(fā)邏輯”的屏幕保護(hù),只要鏡頭拍到他,屏幕就自動(dòng)從動(dòng)作片跳到“研究算法分發(fā)”這個(gè)頁(yè)面上,老板就會(huì)認(rèn)為我在努力工作。

      核心的問(wèn)題來(lái)了——為什么只要攝像頭拍到他,我的屏幕就能變化?因?yàn)槲易隽艘惶兹四樧R(shí)別系統(tǒng)。我用盡一切手段(包括上百度搜索、賄賂他的秘書等等),收集了老板10萬(wàn)張照片,然后輸入到我的計(jì)算機(jī)里,計(jì)算機(jī)對(duì)這些照片進(jìn)行學(xué)習(xí)(學(xué)習(xí)又分為有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)等等,總之就是拼命學(xué)),于是可以判斷出攝像頭拍到的照片和我輸入的照片的相似性。一旦相似度達(dá)到一定的數(shù)值,就認(rèn)定是老板走過(guò)來(lái)了。于是就給屏幕下達(dá)指令,迅速?gòu)腁V切換到研究算法分發(fā)的頁(yè)面。

      這就叫人工智能(AI)。人工智能是最大的概念。而向計(jì)算機(jī)里輸入照片,學(xué)習(xí)辨別此人是不是老板的過(guò)程,就是機(jī)器學(xué)習(xí)。人工智能有很多應(yīng)用,比如這個(gè)小故事里講的叫“人臉識(shí)別”,此外還包括無(wú)人駕駛、健康診斷,著名的阿爾法狗則是人工智能在圍棋領(lǐng)域的應(yīng)用。在一點(diǎn)資訊的應(yīng)用,就是通過(guò)算法分發(fā)信息,實(shí)現(xiàn)千人千面、私人定制。

      全球最偉大的人工智能公司是谷歌。他們有一個(gè)機(jī)構(gòu)叫“谷歌大腦”,主要研究人工智能的應(yīng)用;中國(guó)的百度公司也在向人工智能公司進(jìn)發(fā),他們通過(guò)搜索積累了大量的數(shù)據(jù),這就如同上一個(gè)小故事里講的搜集照片的過(guò)程——沒(méi)有大數(shù)據(jù),無(wú)法實(shí)現(xiàn)人工智能。

      2、要實(shí)現(xiàn)精準(zhǔn)分發(fā)有三個(gè)要素:一是用戶畫像,二是文章畫像,三是算法模型。

      用戶畫像:他是誰(shuí)?喜歡什么?

      文章畫像:這是什么內(nèi)容?是圖文、視頻還是圖集?是時(shí)政、社會(huì)還是財(cái)經(jīng)?這個(gè)內(nèi)容是好是壞?

      算法模型:用戶畫像和文章畫像之間,以什么樣的方式來(lái)匹配?

      先看用戶畫像。

      如上圖展示:在用戶畫像中,生活環(huán)境是基礎(chǔ)。生活環(huán)境又包括兩個(gè)層次,第一是地理位置。一點(diǎn)資訊已經(jīng)能定位到商圈和小區(qū),而百度地圖、滴滴打車已經(jīng)能實(shí)時(shí)定位到你站的地方。衣食住行、水電煤氣,包括政府提供的產(chǎn)品服務(wù),都和你的生活環(huán)境、地理位置有關(guān)系,所以,地理位置越精準(zhǔn)越好。

      時(shí)間場(chǎng)景來(lái)說(shuō),早上推的東西應(yīng)該是硬的、偏資訊類的內(nèi)容,因?yàn)檫^(guò)了一夜,大家需要看到昨晚發(fā)生了什么。而且,上班族在早晨都比較忙,沒(méi)有時(shí)間看長(zhǎng)篇大論。到了晚上則相反,用戶有時(shí)間而且希望放松,所以需要推送偏軟性、偏娛樂(lè)的內(nèi)容,包括一些美文——在安靜的夜里,才能讀出其中的味道。

      第二個(gè)層次是手機(jī)環(huán)境。它同樣包含兩個(gè)含義,一是手機(jī)型號(hào),不同型號(hào)的手機(jī)使用者的閱讀習(xí)慣是不一樣的,比如紅米用戶和蘋果用戶。即使是同一個(gè)品牌的手機(jī)——OPPO A57和OPPO R11,使用者的閱讀習(xí)慣也是不相同的,這都需要我們通過(guò)數(shù)據(jù)去洞察。另外,我們的手機(jī)里激活了哪些軟件,使用的頻率如何,在不影響用戶隱私的情況下,都需要去深刻洞察。

      第三個(gè)層次是用戶信息。如果你是注冊(cè)用戶,你的性別、年齡、身份、學(xué)歷等,都可以成為我們判斷你興趣的依據(jù)。另外,為了把一個(gè)用戶畫像描述得更精準(zhǔn),一點(diǎn)資訊設(shè)計(jì)了一個(gè)開(kāi)屏問(wèn)卷——問(wèn)用戶喜歡什么。有超過(guò)50%的用戶做了選擇,于是,我們能夠了解到他們的基本興趣。當(dāng)然,也有人不愿意填寫,甚至不愿意透露自己的地理位置。所以,這就給我們提出了難題——冷啟動(dòng)時(shí),應(yīng)該給用戶提供哪些信息。

      3、落地頁(yè)是關(guān)鍵

      落地頁(yè),指用戶打開(kāi)網(wǎng)頁(yè)后或下載某個(gè)App后第一次打開(kāi)見(jiàn)到的頁(yè)面。它如同戀愛(ài)的第一次見(jiàn)面,它的重要性毋庸置疑用戶打開(kāi)之后呈現(xiàn)的第一屏,大概有5條信息。測(cè)試表明,如果在這5條中,用戶點(diǎn)擊了一條,那么它的次日留存率就會(huì)比沒(méi)有點(diǎn)擊的人高一倍。所以,花多大精力去打造這5條內(nèi)容都不為過(guò)。為此,我們做了大量的對(duì)比試驗(yàn)——包括嘗試推送相關(guān)型號(hào)手機(jī)的資訊,包括推送相關(guān)地理位置的資訊,有成功也有失敗。在冷啟動(dòng)中,因?yàn)橛脩舢嬒癫粔蚯逦?,所以基本原則應(yīng)該是推送重要事件、大概率領(lǐng)域(比如足球,而不是高爾夫球),而不能推送拿些小眾內(nèi)容去賭,否則你很容易失敗。

      當(dāng)用戶閱讀完首屏內(nèi)容之后,可能會(huì)產(chǎn)生五種情況:

      (1)有點(diǎn)擊下拉;(2)無(wú)點(diǎn)擊下拉;(3)無(wú)點(diǎn)擊上滑;(4)有點(diǎn)擊上滑;(5)直接走人。針對(duì)這些不同的行為方式,我們應(yīng)該啟動(dòng)不同的策略。這需要非常細(xì)膩的數(shù)據(jù)觀察,要從中總結(jié)規(guī)律。從此,用戶的行為也變得多樣化——比如點(diǎn)擊、分享、收藏、評(píng)論、用戶停留時(shí)長(zhǎng)等等,這都是算法判斷推送哪些內(nèi)容的依據(jù)。

      這是一個(gè)非常復(fù)雜的運(yùn)算過(guò)程。比如,有個(gè)用戶點(diǎn)擊了五次“吳晨光”,搜索了一次“鄒明”(鳳凰網(wǎng)總編輯),如果只給他推一條,應(yīng)該先推“吳晨光”還是“鄒明”?從數(shù)量上來(lái)說(shuō),一定是“吳晨光”更多,但是搜索屬于深度行為,他主動(dòng)去搜索說(shuō)明對(duì)“鄒明”很感興趣,這種情況應(yīng)該去推誰(shuí)?

      再如,他點(diǎn)擊了五次“吳晨光”,點(diǎn)了兩次“鄒明”。但關(guān)于吳晨光的優(yōu)質(zhì)內(nèi)容沒(méi)有了,只有關(guān)于“鄒明”的好文章,那是應(yīng)該推一條很水的關(guān)于“吳晨光”的文章,還是推出關(guān)于 “鄒明”的好文章?

      還有,他點(diǎn)了五次“吳晨光”的圖文,要不要推一個(gè)視頻、音頻或者問(wèn)答?或者一個(gè)用戶很喜歡“吳晨光”,今天突然出了“鄒明”的緋聞,是應(yīng)該把“鄒明”的熱點(diǎn)推出來(lái),還是,依然根據(jù)用戶的興趣繼續(xù)推“吳晨光”?

      所以,用戶畫像的復(fù)雜性,不是簡(jiǎn)簡(jiǎn)單單的群體劃分問(wèn)題。它是對(duì)人性的深刻洞察,一個(gè)行為,比如點(diǎn)擊,背后的含義也完全不同,有的是因?yàn)檎娴母信d趣,有的是因?yàn)闃?biāo)題黨。

      再看文章畫像。對(duì)于編輯而言,文章畫像相對(duì)簡(jiǎn)單,因?yàn)檫@是我們的專業(yè)。在傳統(tǒng)媒體時(shí)代,我們就對(duì)文章進(jìn)行畫像——比如說(shuō)消息、通訊、特稿,還包括我一直在嘗試的調(diào)查報(bào)道和解釋性報(bào)道。

      當(dāng)然,今天的文章畫像的復(fù)雜性遠(yuǎn)遠(yuǎn)高于傳統(tǒng)媒體時(shí)代。因?yàn)檫@里的文章泛指內(nèi)容,而不是單純的文字概念。它包括:

      體裁——是文字、圖片、視頻、音頻、直播,還是問(wèn)答,或者類似微博的短內(nèi)容?

      作者——作者其實(shí)代表著背后的自媒體號(hào),包括它的級(jí)別、知名度、訂閱數(shù)等;

      標(biāo)簽——這是對(duì)于文章描述的領(lǐng)域的認(rèn)知,比如體育—足球—中超—國(guó)安。我們把打標(biāo)簽的權(quán)力交給了自媒體作者,他們可以在自己生產(chǎn)的內(nèi)容下打好標(biāo)簽。同時(shí),我們的審核編輯、頻道編輯會(huì)修正標(biāo)簽;算法也會(huì)對(duì)標(biāo)簽做進(jìn)一步調(diào)整。最后綜合評(píng)判,給文章一個(gè)最準(zhǔn)確的定位。如果是算法很聰明,做了深度學(xué)習(xí),那么還可以分析出更多關(guān)于文章的特點(diǎn),也就是像人一樣,去理解文章的中心思想、段落大意。當(dāng)然,這個(gè)很難。特別是對(duì)視頻、圖片的識(shí)別更難。

      內(nèi)容質(zhì)量——它有兩個(gè)維度,第一是編輯判斷,第二是算法判斷。編輯的判斷前面已經(jīng)講過(guò),無(wú)非是選題、采訪、寫作和包裝四個(gè)維度;而算法判斷無(wú)非依據(jù)數(shù)據(jù),還是點(diǎn)擊、分享、收藏、用戶停留時(shí)長(zhǎng)等等。

      用戶畫像有了,文章畫像也有了。我們現(xiàn)在開(kāi)始匹配。匹配的依據(jù)就是算法模型。我們可以把模型做詳細(xì)拆解,分為很多模塊——比如垃圾過(guò)濾模塊、熱點(diǎn)模塊、本地模塊等等。算法在每個(gè)模塊里,進(jìn)行文章的挑選、排序;不同模塊里的文章也在進(jìn)行競(jìng)爭(zhēng)、排序。最后擇準(zhǔn)、擇優(yōu)分發(fā)給用戶。

      我們以熱點(diǎn)模塊為案例,做具體分析。

      熱點(diǎn)是一個(gè)很好理解的詞,就是剛剛發(fā)生的、關(guān)注度較高的新聞。它有別于其它非時(shí)效性的資訊。首先,我們要告訴算法,什么是熱點(diǎn)。這里有很多方式——比如,監(jiān)控百度。百度熱搜詞可能就是熱點(diǎn)。在一點(diǎn)資訊要聞?lì)l道,編輯置頂?shù)囊彩菬狳c(diǎn)。我們還可以人工定義一些文章是熱點(diǎn):比如掛“新華社快訊”字頭的就認(rèn)為是熱點(diǎn)。這是第一步。讓算法了解熱點(diǎn),這就是機(jī)器學(xué)習(xí)。

      第二步,我們要把熱點(diǎn)內(nèi)容做“召回”。這里的召回和問(wèn)題汽車的召回不一樣,是指把相關(guān)熱點(diǎn)文章聚集在某一個(gè)池子里。我們稱之為“熱點(diǎn)池”。我們會(huì)把熱點(diǎn)池分若干層次,在3年前,我就在《超越門戶》中描述了搜狐網(wǎng)重大突發(fā)事件的規(guī)則,從三級(jí)到特級(jí)。來(lái)一點(diǎn)資訊做總編輯后,又進(jìn)行了進(jìn)一步修訂?,F(xiàn)在,我們把標(biāo)準(zhǔn)通個(gè)案例的方式輸入計(jì)算機(jī),讓算法來(lái)判斷熱點(diǎn)的大小,以決定向什么樣的群體進(jìn)行推送。

      一文即可明白什么是:用戶畫像、文章畫像與智能推送

      文章分為兩個(gè)類型——抓取源文章(RSS)和自媒體文章。但不管什么樣的文章,都需要經(jīng)過(guò)反垃圾模塊的過(guò)濾,去除有害政治信息、低俗內(nèi)容、虛假?gòu)V告、“標(biāo)題黨”文章等。所以,反垃圾模塊里應(yīng)該有這些功能。如果你問(wèn),這些功能是如何實(shí)現(xiàn)的,那還是前面提到的答案——輸入案例或者關(guān)鍵詞,讓機(jī)器學(xué)習(xí),找到特征并舉一反三。

      垃圾過(guò)濾之后,算法或者編輯給文章打了標(biāo)簽、做了分類,文章就聚集在各種池子里。剛才說(shuō)了,這個(gè)過(guò)程就叫做召回。按照文章的標(biāo)簽分類以及不同的屬性,它們被分配到各個(gè)池子里——包括我們剛才所說(shuō)的熱點(diǎn)模塊、本地模塊,還包括被編輯挑出來(lái)的好文章,進(jìn)入精品池模塊。如果有些文章又有本地屬性、又是精品,就會(huì)同時(shí)放在兩個(gè)池子里。還有一些文章,被打上了體育標(biāo)簽或者財(cái)經(jīng)標(biāo)簽,就放在了體育或者財(cái)經(jīng)的池子里。

      最后到了分發(fā)過(guò)程,主要是針對(duì)某一個(gè)用戶,這么多內(nèi)容先出誰(shuí)后出誰(shuí)。這就是排序。用戶下拉首頁(yè)流看到的內(nèi)容,就是排好序的。其它頻道流也是如此。排序具體的規(guī)則取決于算法,也就是說(shuō)用戶畫像、文章畫像和算法模型之間的關(guān)系。剛才,我們已經(jīng)討論過(guò)了。

      關(guān)于如何去衡量分發(fā)的效果,大概有幾個(gè)點(diǎn):

      第一是準(zhǔn)——推的東西就是用戶喜歡的;

      第二是快——好內(nèi)容要第一時(shí)間推送;

      第三是優(yōu)——同一領(lǐng)域的文章,一定是先推高品質(zhì)的。否則,我們的優(yōu)質(zhì)內(nèi)容就沒(méi)有流量,獲得不了利益和影響力。優(yōu)秀的自媒體人也會(huì)因此遠(yuǎn)離這個(gè)平臺(tái),進(jìn)而形成惡性循環(huán)。

      最后是寬——不讓用戶陷入信息孤島。要有準(zhǔn)確的興趣探測(cè),能預(yù)判你喜歡什么不喜歡什么。這就是我們講的,保證用戶的更多“知情權(quán)”。

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多