人妻网站成熟人妻VA网站,日本丶国产丶欧美色综合

<noscript id="mmmmm"><dd id="mmmmm"></dd></noscript>

<nav id="mmmmm"></nav><tfoot id="mmmmm"></tfoot><tfoot id="mmmmm"></tfoot>

<nav id="mmmmm"><sup id="mmmmm"></sup></nav>

<small id="mmmmm"></small><noscript id="mmmmm"><optgroup id="mmmmm"></optgroup></noscript>

明輝手游網(wǎng)中心：是一個(gè)免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺(tái)！

文章發(fā)布全站軟件文章熱門搜索：免費(fèi) 卡住全屏聲音黑屏影音資訊首頁騰訊視頻愛奇藝暴風(fēng)影音酷狗音樂酷我音樂影音大全軟件下載軟件教程電腦系統(tǒng)下載聊天工具辦公軟件殺毒教程系統(tǒng)工具圖形圖像電腦學(xué)習(xí)應(yīng)用軟件網(wǎng)絡(luò)軟件蘋果應(yīng)用注冊(cè)碼網(wǎng)站教程技術(shù)開發(fā)安卓教程其它教程您當(dāng)前所在位置：網(wǎng)視手游站 -> 應(yīng)用軟件 -> 基于Tags完成內(nèi)容推薦的方法（代碼）
基于Tags完成內(nèi)容推薦的方法（代碼）發(fā)表時(shí)間：2023-07-09 來源：明輝站整理相關(guān)軟件相關(guān)文章人氣： [摘要]本篇文章給大家?guī)淼膬?nèi)容是關(guān)于基于Tags實(shí)現(xiàn)內(nèi)容推薦的方法（代碼），有一定的參考價(jià)值，有需要的朋友可以參考一下，希望對(duì)你有所幫助。原來為了簡(jiǎn)單方便，自己小網(wǎng)站上的文章頁的相關(guān)內(nèi)容推薦就是從數(shù)據(jù)庫里... 本篇文章給大家?guī)淼膬?nèi)容是關(guān)于基于Tags實(shí)現(xiàn)內(nèi)容推薦的方法（代碼），有一定的參考價(jià)值，有需要的朋友可以參考一下，希望對(duì)你有所幫助。原來為了簡(jiǎn)單方便，自己小網(wǎng)站上的文章頁的相關(guān)內(nèi)容推薦就是從數(shù)據(jù)庫里隨機(jī)抽取數(shù)據(jù)來填充一個(gè)列表，所以一點(diǎn)相關(guān)性都沒有，更本沒有辦法引導(dǎo)用戶去訪問推薦內(nèi)容。算法選擇如何能做到相似內(nèi)容的推薦呢，礙于小網(wǎng)站還跑在虛擬主機(jī)上（對(duì)的，連一個(gè)自己完整可控的服務(wù)器都沒有），所以可以想的辦法不多，條件限制在只能用PHP+MySql。所以我想到的辦法就是通過Tags來匹配相似文章進(jìn)行推薦。如果兩篇文章的TAGS 比較相似比如：文章A 的TAGS為： [A,B,C,D,E] 文章B 的 TAGS 為：[A,D,E,F,G] 文章C 的 TAGS 為：[C,H,I,J,K] 通過眼睛我們能很方便的發(fā)現(xiàn)，文章B和文章A更為相似，因?yàn)樗鼈冇腥齻€(gè)關(guān)鍵字相同分別為：[A,D,E]，哪如何用計(jì)算機(jī)來判斷它們的相似度呢，這里我們用jaccard相似度的最基本應(yīng)用來計(jì)算它們的相似度 jaccard相似度給定兩個(gè)集合A,B，Jaccard 系數(shù)定義為A與B交集的大小與A與B并集的大小的比值，定義如下：文章A和文章B的交集為 [A,D,E],大小為3，并集為[A,B,C,D,E,F,G],大小為7，3/7=0.4285... 而文章A和文章C交集為 [C],大小為1，并集為[A,B,C,D,E,H,I,J,K],大小為9， 1/9=0.11111... 這樣就可以得出文章A，B比文章A，C更為相似，有了這個(gè)算法，計(jì)算機(jī)就可以來判斷兩篇文章的相似度了。具體的推薦思想給定一篇文章，獲取該文章的關(guān)鍵字TAGS,然后通過以上算法去數(shù)據(jù)庫比對(duì)所有文章的相似度，獲取最相似的N篇文章進(jìn)行推薦。實(shí)現(xiàn)過程第一 TAGS的獲取文章的TAGS是通過TF-IDF算法，提取文章中的高頻詞，選取N個(gè)作為TAGS，對(duì)于中文的文章來說還涉及到一個(gè)中文分詞的問題，因?yàn)槭翘摂M主機(jī)的關(guān)系，這步的工作我用python（為什么用Python ,jieba分詞，真香）在本地寫了一個(gè)程序，完成所有文章的分詞，詞頻統(tǒng)計(jì)，生成TAGS，并寫回服務(wù)器的數(shù)據(jù)庫。由于本文是寫推薦的算法，所以分詞和建立TAGS的部分就不具體展開了，而且不同的系統(tǒng)有不同的TAGS建立方式。第二 TAGS的存儲(chǔ) 建立兩張表，用于存儲(chǔ)TAGS tags，用于存所有tag的名稱 +-------+------------+------+-----+---------+-------+ Field Type Null Key Default Extra +-------+------------+------+-----+---------+-------+ tag text YES NULL count bigint(20) YES NULL tagid int(11) NO PRI 0 +-------+------------+------+-----+---------+-------+ tag_map 建立tag和文章的映身關(guān)系。 +-----------+------------+------+-----+---------+-------+ Field Type Null Key Default Extra +-----------+------------+------+-----+---------+-------+ id bigint(20) NO PRI 0 articleid bigint(20) YES NULL tagid int(11) YES NULL +-----------+------------+------+-----+---------+-------+ tag_map存的數(shù)據(jù)類似如下： +----+-----------+-------+ id articleid tagid +----+-----------+-------+ 1 776 589 2 776 471 3 776 1455 4 776 1287 5 776 52 6 777 1386 7 777 588 8 777 109 9 777 603 10 777 1299 +----+-----------+-------+ 其實(shí)做相似推薦的時(shí)候，只需要用到tag_map表就可以了，因?yàn)閠agid和tag name 是一一對(duì)應(yīng)的。具體編碼 1.獲取所有文章對(duì)應(yīng)的TAGID mysql> select articleid, GROUP_CONCAT(tagid) as tags from tag_map GROUP BY articleid; +-----------+--------------------------+ articleid tags +-----------+--------------------------+ 12 1178,1067,49,693,1227 13 196,2004,2071,927,131 14 1945,713,1711,2024,49 15 35,119,9,1,1180 16 1182,1924,2200,181,1938 17 46,492,414,424,620 18 415,499,153,567,674 19 1602,805,691,1613,194 20 2070,1994,886,575,1149 21 1953,1961,1534,2038,1393 +-----------+--------------------------+ 通過以上SQL,可以一次性查詢所用文章，極其對(duì)應(yīng)的所有tag 在PHP，我們可以把tags變成數(shù)組。 public function getAllGroupByArticleId(){ //緩存查詢數(shù)據(jù)，因?yàn)檫@個(gè)是全表數(shù)據(jù)，而且不更新文章不會(huì)變化，便是每次推薦都要從數(shù)據(jù)庫里獲取一次數(shù)據(jù)，對(duì)性能肯定會(huì)有影響，所以做個(gè)緩存。 if($cache = CacheHelper::getCache()){ return $cache; } $query_result = $this->query('select articleid, GROUP_CONCAT(tagid) as tags from tag_map GROUP BY articleid'); $result = []; foreach($query_result as $key => $value){ //用articleid 做key ,值是該id下的所有tagID數(shù)組。 $result[$value['articleid']] = explode(",",$value['tags']); } CacheHelper::setCache($result, 86400); return $result; } 有了這個(gè)的返回結(jié)果，就比較好辦了，接下去的工作就是去應(yīng)用jaccard相似度這個(gè)算法了，具體就看代碼吧。 /** * [更據(jù)指定文章返回相似的文章推薦] * @param $articleid 指定的文章ID * @param $top 要返回的推薦條數(shù) * @return Array 推薦條目數(shù)組 / function getArticleRecommend($articleid, $top = 5){ if($cache = CacheHelper::getCache()){ return $cache; } try{ $articleid = intval($articleid); $m = new TagMapModel(); $all_tags = $m->getAllGroupByArticleId();//調(diào)用上面的函數(shù)返回所有文章的tags $finded = $all_tags[$articleid];//因?yàn)樯厦媸前形恼铝�，所以肯定包含了�?dāng)前文章。 unset($all_tags[$articleid]);//把當(dāng)前文章從數(shù)組中刪除，不然自己和自己肯定是相似度最高了。 $jaccard_arr = []; //用于存相似度 foreach ($all_tags as $key => $value) { $intersect =array_intersect($finded, $value); //計(jì)算交集 $union = array_unique(array_merge($finded, $value)); //計(jì)算并集 $jaccard_arr[$key] = (float)(count($intersect) / count($union)); } arsort($jaccard_arr); //按相似度排序，最相似的排最前面 $jaccard_keys = array_keys($jaccard_arr);//由于數(shù)組的key就是文章id,所以這里把key取出來就可以了 array_splice($jaccard_keys, $top);//獲取前N條推薦 //到這里我們就已經(jīng)得到了，最相似N篇文章的ID了，接下去的工作就是通過這幾個(gè)ID,從數(shù)據(jù)庫里把相關(guān)信息，查詢出來就可以了 $articleModels = new \Api\Model\ArticleModel(); $recommendArticles = $articleModels->getRecommendByTag($jaccard_keys); CacheHelper::setCache($recommendArticles, 604800); //緩存7天 return $recommendArticles; } catch (\Exception $e) { throw new \Exception("獲取推薦文章錯(cuò)誤"); } } 相關(guān)推薦： PHP簡(jiǎn)單實(shí)現(xiàn)“相關(guān)文章推薦”功能的方法以上就是基于Tags實(shí)現(xiàn)內(nèi)容推薦的方法（代碼）的詳細(xì)內(nèi)容，更多請(qǐng)關(guān)注php中文網(wǎng)其它相關(guān)文章！微信分享學(xué)習(xí)教程快速掌握從入門到精通的SQL知識(shí)。標(biāo)簽：基于Tags完成內(nèi)容推薦的辦法（代碼）* 上一篇：怎么使JDK導(dǎo)入證書下一篇：怎么理解MySQL數(shù)據(jù)庫的優(yōu)化	推薦資訊總?cè)藲獍?/span> 1PS提示：因?yàn)閳D層已鎖定，無法編輯圖層的處理方法 2picacg蘋果版怎么找不到\|picacg ios版是不是下架了介紹 3Adobe Illustrator CS5 序列號(hào)大全 4ACDsee注冊(cè)碼免費(fèi)分享（含ACDsee18、ACDsee10等版本） 5Potato(土豆聊天)怎么換頭像\|Potato app更改頭像方法介紹 6PDF瀏覽器能看3D文件嗎？PDF瀏覽器看3D文件圖文詳細(xì)教程 7Potato(馬鈴薯聊天)怎么注冊(cè)不了\|Potato不能注冊(cè)處理方法介紹 8最新的Adobe Illustrator CS4序列號(hào)大全 9Intel i7-9700K性能跑分曝光：同代提升約12% 10XP系統(tǒng)怎么清除緩存？ 11Intel Z390主板有望10月8日公布：8核9代酷睿隨后登場(chǎng) 12XP系統(tǒng)安裝chrome無法找到入口怎么處理？ 1本文教你SQL：7從子表里刪除數(shù)據(jù) 2存儲(chǔ)過程基礎(chǔ)與提高 3教你在SQL Server 2000數(shù)據(jù)庫中使用分區(qū) 4SQL Server SQL語句導(dǎo)入備份大全 5安裝 Microsoft SQL Server 6SQL Server 2005探密 7SQL中DATALENGTH 用法 8所有方面接觸SQL語法 4 9所有方面接觸SQL語法 7 10破解Mysql root密碼的幾種方法 11用SQL語句完成SQL Server數(shù)據(jù)庫的修好 12本文教你SQL：9datetime與interval數(shù)據(jù)分類最新教程本月人氣 1Intel 10nm難產(chǎn)服務(wù)器也擠牙膏：下代依然28核心 2Intel傲騰首次殺入外置硬盤：高玩尤物 3硬罡AMD銳龍！Intel主流8核心產(chǎn)品亮相臺(tái)北電腦展？ 4取代酷睿！Intel新CPU微架構(gòu)Ocean Cove曝光：劍指2020 5Intel公布2018 Q1財(cái)報(bào)：利潤(rùn)大漲50%、CPU保持增長(zhǎng) 6顯卡瘋狂漲價(jià)買不到：AMD 3A套裝送“福利” 7AMD清庫存出奇招！Intel/NVIDIA望塵莫及 8Intel官方偷跑8核心8代酷睿CPU：配合Z390送大禮？ 9電腦高手為什么不買Intel i7?很容易 10x86 40周年紀(jì)念！Intel i7-8086K怒飆5GHz 115.88GHz！AMD Ryzen二代真能超：差一些破紀(jì)錄 127nm Navi被曝僅GTX 1070級(jí)別：A卡新旗艦跳票2020 1autocad20073維制圖圖文詳細(xì)教程：畫容易的彈簧 2cad2007畫橄欖球的2種方法 3cad2007繪制廚房用的水槽的圖文詳細(xì)教程 4cad3維制圖圖文詳細(xì)教程:曲線彈簧的畫法 5有什么技巧可以提高AutoCAD2007的繪圖效率？ 6AutoCAD 2007裁剪范圍外對(duì)象的圖文詳細(xì)教程 7AutoCAD 2007選擇編輯的使用技巧 8蘋果iPhone怎么升級(jí)天翼4G信號(hào)王 9添加聲音批注讓文檔批注有聲有色 10小黃車被刮碼怎么用\|小黃車碼被劃知道決方法介紹 11qq音樂\|qq音樂下文怎么清空 qq音樂播放下文清空方法介紹 12樂派英雄聯(lián)盟\|樂派英雄聯(lián)盟寶盒為什么用不了
相關(guān)文章 MySQL數(shù)據(jù)分類有哪一些？MySQL數(shù)據(jù)分類詳細(xì)說明詳細(xì)說明MySQ怎么完成數(shù)據(jù)備份 MySQL字符集是什么?字符集的相關(guān)介紹 MySQL中binlog日志文件的詳細(xì)介紹 MySQL中行鎖、頁鎖與表鎖的容易介紹 MySQL中鎖的必要性及分類介紹 MySQL怎么完成單表查詢？MySQL單表查詢語句數(shù)據(jù)庫完成大局部刪除數(shù)據(jù)的設(shè)置方法（代碼案例） MongoDB中常用的語句總結(jié) MySQL怎么通過案例化對(duì)象參數(shù)查詢數(shù)據(jù) ？（源代碼） MySQL中int、char以及varchar的性能比較 oracle使用索引與不使用索引時(shí)的性能比較

<tr id="m8mmm"></tr>

<nav id="m8mmm"><sup id="m8mmm"></sup></nav>