当前位置 博文首页 > 舒哥的blog:搜索,推荐,广告系统架构及算法技术资料大合集吐血

    舒哥的blog:搜索,推荐,广告系统架构及算法技术资料大合集吐血

    作者:[db:作者] 时间:2021-07-31 09:03

    算法学习资料: AI_Tutorial

    架构、搜索、推荐、广告系统优质资源

    你还在为学习算法摸不着头脑么?你还在为技术调研各种Google么?AI的牛b吹不上去?盯紧了,这里就是你的2020女朋友~。本项目会持续关注AI落地的一些优质技术资料。大家也可以去网站投稿。
    算法学习资料: AI_Tutorial 记得Star哦~!

    后端架构、AI架构、搜索系统、推荐系统、广告系统技术资料整理。这篇文章意图是收集市面上质量不错的后端架构、AI架构、搜索、 推荐、 广告引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(AIQ 、infoQ、Stackoverflow、github 等、国内外知名互联网公司技术博客(阿里中间件团队博客、美团技术博客等)、知名技术牛人公众号博客等。
    以下整理的内容大致根据来源进行分类。@AIQ-人工智能

    github地址:https://github.com/cbamls/full_stack_coder

    个人视角有限,谢谢。


    开源相关

    Lucene

    • Lucene 官网

    • Lucene 7.6.0源码

    • Lucene Wiki

    • 索引结构 -Lucene6.6.0

    Solr

    • Solr 官网

    • Solr Wiki

    Elastic

    • Elastic 官网

    • Elastic Blog

    • Elastic Formus

    • Elasticsearch: 权威指南 - 中文版

    • Elastic 中文社区

      LucidWorks

    • LucidWorks

    • LucidWorks Blog

    中文分词

    • ansj 分词

    • HanLP 分词

    • ES-Analysis-IK

    大公司

    阿里

    • 天猫推荐算法团队的那些事儿 - 20140401 - infoQ
      本文以访谈的方式呈现,对搜索和推荐算法进行了简单的比较,提到了 AB 测试和离线测试,主要对推荐算法团队的工作方式、工作考评、任务分配、招聘等进行了介绍。

    • 天猫 11.11:搜索引擎实时秒级更新 - 20141111 - infoQ
      文章简单介绍了阿里搜索引擎架构,提到了以下内容:1)为提高数据实时性(库存、价格等),去掉应用层和业务层的缓存,重点提升引擎层的服务能力。2)排序链,根据业务场景定制排序链。3)sku 搜索,搜索结果和属性导航联动(标类产品)。

    • 阿里搜索离线技术团队负责人谈 Hadoop:阿里离线平台、YARN 和 iStream

    • 基于 Apache Flink 的实时计算引擎 Blink 在阿里搜索中的应用 - 20170216 - infoQ

    • 阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景 - 20181128 - AIQ

    • 阿里巴巴搜索引擎平台 Ha3 揭秘 - 201811 - AIQ

    阿里搜索事业部技术团队
    阿里集团搜索、推荐、图像技术的大本营,大数据时代的创新主场。

    • 阿里搜索事业部技术团队

    • OpenSearch:轻松构建大数据搜索服务 - 20160222

    • 搜索双链路实时计算体系 @双 11 实战 - 20160111

    阿里中间件团队博客
    2012 年期间,阿里中间件博客记录了 20 多篇 Lucene、Solr 相关博文,主要记录了一些在项目开发过程中遇到的问题,以及部分源码解读。内容丰富、实用,但不是很系统。

    • 阿里中间件团队博客

    • Solr 调优参考 - 20120521

    • Solr Lucene 优劣势分析 - 20120626

    • SolrQuery 性能压测参考 - 20120731

    • NumericField NumericRangeQuery 原理分析 - 20120731

    • Solr schema 编写指导 - 20120731

    • 关于搜索挖掘所想 - 20120731

    • SolrQuery 挖掘 – 单维度聚合分析 - 20120920

    • 我感受到的排序机制参考 - 20120920

    • 垂直搜索新问题 - 20120920

    • Solr 平台化搜索实战必知场景 - 20120921

    • Solr Schema 配置小细节大问题 - 20121015

    • Solr DisjunctionMax 注解 - 20121015

    • Sql Support within Solr- 类 Sql 的 solr 搜索实现 (1) - 20121015

    • Sql Support within Solr- 类 Sql 的 solr 搜索实现 (2) - 20121015

    • 关于 TrieField 的全面认识、理解、运用 - 20121015

    • Solr Facet 引发思考 on the road - 20121029

    • 查询问题 —queryparse 深入理解 - 20121029

    • TermRangeQuery 源码解析 - 20121106

    • Solr 之缓存篇 - 20121106

    • 搜索的测试话题 - 20121113

    • 关于搜索夜话 ---- 作为阶段序列的告别 - 20121113

    • solr 长文本搜索问题 - 20121210

    • SolrCore2.9.1 源码分析备忘 - 20121210

    百度

    • 百度万亿量级数据库 Tera 架构应用、设计与实践全攻略 - 20170526 - infoQ

    京东

    • 京东 618:揭秘大促销背后的个性化推荐 - 20150618 - infoQ

    • 京东 11.11:商品搜索系统架构设计 - 20151111 - infoQ

    • 京东 618:机器学习与商品数据挖掘和知识抽取 - 20170618 - infoQ

    美团点评

    美团点评技术团队博客
    在国内互联网公司中,个人认为“美团点评技术团队博客”是最持之以恒的,而且非常干货。

    • 美团点评技术团队

    • 美团 O2O 排序解决方案——线下篇 - 20151207

    • 美团O2O排序解决方案——线上篇 - 2015-11-16 17:00

    • 美团点评旅游搜索召回策略的演进 - 20170616 - AIQ

    携程

    • 携程技术中心

    去哪儿

    • 去哪儿网机票搜索系统的高并发架构设计 20170421 - AIQ

    搜狗

    • 搜狗搜索广告检索系统 - 弹性架构演进之路 - 20160111 - infoQ

    • 深度学习在搜狗无线搜索广告中的应用 - 20160808 - infoQ

    • 以搜狗为例,谈语音输入如何影响你的生活 - 20161208 - infoQ

    一号店

    • 1 号店 11.11:分布式搜索引擎的架构实践 - 20151112 - infoQ

    • 1 号店 11.11:机器排序学习在电商搜索中的实战 - 20161111 - AIQ

    • 机器学习在 1 号店商品匹配中的实践 - 20170506 - 携程技术中心

    待分类

    国内

    • 当当 11.11:促销系统与交易系统的重构实践 - 20151113 - infoQ

    • 苏宁易购 11.11:商品详情系统架构设计 - 20151227 - infoQ

    • 达观数据 点击模型:提升算法精度的利器 - 20160315 - infoQ

    • 达观数据 一个可供参考的搜索引擎排序架构实践案例 - 20160830 - infoQ

    • 达观数据 “搜你所想” 之用户搜索意图识别 - 20170608 - AIQ

    • 链家网 数据驱动在搜索优化与推荐策略中的实践 - 20170406 - infoQ

    • 深度学习在 Airbnb 大规模搜索排名上的实战经验 - 20181118 - AIQ

    • 51 信用卡的个性化推荐体系 - 2018 - AIQ

    • 苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用 - 20181105 - AIQ
      国外

    • Twitter 实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程 - 20160330 - infoQ

    • Yelp 是如何用数据驱动搜索过滤器的? - 20151209 - infoQ

    开发应用

    理论基础

    • 我爱自然语言处理 推荐

    • 漫话中文自动分词和语义识别

    源码解读

    • 刘超觉先 详细分析了 Lucene3.x 的源码,推荐。

    • Anatomy of an Elasticsearch Cluster: Part I

    • Anatomy of an Elasticsearch Cluster: Part II

    • Anatomy of an Elasticsearch Cluster: Part III

    常见问题

    • Stackoverflow - Lucene

    • Stackoverflow - Solr

    • Stackoverflow - Elastic

    其他

    • 对话 Kibana 之父:如果需要,你应该自己动手编写工具 - 20170111 - infoQ

    • 配置高性能 Elasticsearch 集群的 9 个小贴士 - 20170104 - infoQ

    • 基于 ElasticStack 的数据探索与分析 - 20161018 - infoQ

    • 使用 Akka、Kafka 和 ElasticSearch 等构建分析引擎 - 20160825 - infoQ

    • 万亿级日志与行为数据存储查询技术剖析 - 20170222 - infoQ

    • 谷歌的自然语言部门是啥样的? - 20160118 - infoQ

    • 通过 Baratine 将 Lucene 库暴露为微服务 - 20160225 - infoQ


    人工智能领域文集

    1. 毕业 10 年才懂,解决问题的能力原来这么重要
    2. 跨境电商 Etsy 如何使用交互行为类型进行可解释推荐
    3. 机器学习模型的可解释性
    4. 个性化海报在爱奇艺视频推荐场景中的实践
    5. 华为招聘
    6. 华为人才招聘
    7. Query 理解和语义召回在知乎搜索中的应用
    8. 推荐系统技术演进趋势:从召回到排序再到重排
    9. 程序员必知必会的零拷贝技术
    10. 推荐系统的发展与简单回顾
    11. 沟通的重要工具——乔哈里视窗
    12. NLP 技术在微博 feed 流中的应用
    13. 机器学习 - 一文理解 GBDT 的原理 -20171001
    14. LR+FTRL 算法原理以及工程化实现
    15. 推荐场景中召回模型的演化过程
    16. 读《影响力》这本书
    17. 系统重构的道与术
    18. CTO 被裁,离职前给组了的高级开发们 8 个建议。
    19. 记录:tf.saved_model 模块的简单使用(TensorFlow 模型存储与恢复)
    20. 淘宝如何拥抱短视频时代?视频推荐算法实战
    21. 解密淘宝推荐实战,打造 “比你还懂你” 的个性化 APP
    22. 风控特征—时间滑窗统计特征体系
    23. 解密商业化广告投放平台技术架构
    24. 深入理解 AQS 之 Condition 源码
    25. IJCAI 2019 | 为推荐系统生成高质量的文本解释:基于互注意力机制的多任务学习模型
    26. Hi, xiaolongnk
    27. Learning to rank 基本算法小结
    28. 知识结构化在阿里小蜜中的应用
    29. 万字长文!推荐系统算法岗校招面试经验 & 学习心得
    30. 标签平滑 & 深度学习:Google Brain 解释了为什么标签平滑有用以及什么时候使用它 (SOTA tips)?
    31. 经验:一个秒杀系统的设计思考
    32. 视频:美图个性化 push AI 探索之路
    33. 优酷 DSP 广告投放系统架构实践
    34. 浅谈微视推荐系统中的特征工程
    35. 知识图谱的自动构建
    36. 美团点评效果广告实验配置平台的设计与实现
    37. 腾讯信息流内容理解技术实践
    38. 深度 |58 商业流量排序策略优化实践
    39. 美团点评 Kubernetes 集群管理实践
    40. 张一鸣:如何应对公司变大之后的管理挑战
    41. 如何提升「会议效率」
    42. 【有赞】数据资产,赞之治理
    43. 搜索引擎中的 Web 数据挖掘
    44. 几十亿数据查询 3 秒返回,ES 性能优化实战!
    45. 基于多视角学习和个性化注意力机制的新闻推荐
    46. Walrus- 一个轻量级 olap 查询框架
    47. 微服务高可用利器——Hystrix 熔断降级原理 & 实践总结
    48. 【推荐实践】微博在线机器学习和深度学习实践
    49. 马蜂窝推荐排序算法模型是如何实现快速迭代的
    50. 在线学习在爱奇艺信息流推荐业务中的探索与实践
    51. 【58 同城】如何从 0 到 1 构建个性化推荐?
    52. 机器学习在 58 二手车估价系统实践
    53. 萌新想请教一下 特征选择 的问题
    54. 实时计算引擎在贝壳的应用与实践
    55. 今日头条在消息服务平台和容灾体系建设方面的实践与思考
    56. 推荐系统中模型训练及使用流程的标准化
    57. 知识图谱与语义分析技术介绍(附前沿论文解读)
    58. 网络图模型知识点综述
    59. 360 展示广告召回系统的演进
    60. Tensorflow 的 checkpoint 教程
    61. 陈曦:性能与稳定并存 Elasticsearch 调优实践
    62. 3000 台服务器不宕机,微博广告系统全景运维大法
    63. 由 Finalizer 和 SocksSocketImpl 引起的 Fullgc 问题盘点
    64. 爱奇艺效果广告的个性化探索与实践
    65. 深度学习技术在美图个性化推荐的应用实践
    66. UC 信息流推荐模型在多目标和模型优化方面的进展
    67. Facebook 面向个性化推荐系统的深度学习推荐模型
    68. 美团配送交付时间轻量级预估实践
    69. 58 招聘推荐排序算法实战与探索
    70. 阿里如何实现秒级百万 TPS?搜索离线大数据平台架构解读
    71. 会向业务“砍需求”的技术同学,该具备哪 6 点能力?
    72. UC 国际信息流推荐中的多语言内容理解
    73. 10 年 +,阿里沉淀出怎样的搜索引擎?
    74. Hi, 2019_nickname
    75. 老大难的 GC 原理及调优,这下全说清楚了
    76. 以 YouTube 论文学习如何在推荐场景应用强化学习
    77. 深度度量学习中的损失函数
    78. UC 信息流视频标签识别技术
    79. 常用学习算法
    80. 阿里妈妈:品牌广告中的 NLP 算法实践
    81. OCPC 广告算法在凤凰新媒体的实践探索
    82. 降低软件复杂性的一般原则和方法
    83. 基于 Elastic Stack 的海量日志分析平台实践
    84. 支付系统高可用架构设计实战,可用性高达 99.999!
    85. 推荐系统应该如何保障推荐的多样性?
    86. 浅谈 UC 国际信息流推荐
    87. 我在亚马逊学到的三样东西,为我的机器学习职业之路做好了准备
    88. 关于数据驱动的重新思考
    89. 头条,美团,滴滴,京东及其它公司面试经验分享!
    90. CCKS 2019 | 百度 CTO 王海峰详解知识图谱与语义理解
    91. 模型评估指标 AUC 和 ROC,这是我看到的最透彻的讲解
    92. GitHub 标星 8k+,最后还有什么想问的么?对面试官的灵魂 50 问!
    93. Andrew Ng(吴恩达) 关于机器学习职业生涯以及阅读论文的一些建议
    94. A/B 测试中我们都会犯的十个常见错误
    95. AI 在爱奇艺视频广告中的探索
    96. 快看漫画个性化推荐探索与实践
    97. 微博广告策略工程架构体系演进
    98. 请问 example oracle 和后面那个红框的分布是什么意思?
    99. 构建可解释的推荐系统
    100. 解读:滴滴“猜你去哪儿”功能的算法实现
    101. 推荐系统走向下一阶段最重要的三个问题
    102. 电商推荐那点事
    103. 风控建模流程:以京东群体感知项目为例
    104. 每天超 50 亿推广流量、3 亿商品展现,阿里妈妈的推荐技术有多牛?
    105. 聊聊 Linux IO 栈
    106. 阿里妈妈深度树检索技术(TDM)及应用框架的探索实践
    107. 推荐系统工程难题:如何做好深度学习 CTR 模型线上 Serving
    108. 360 搜索的百亿级网页搜索引擎架构实现
    109. FSICFR 或者 CFRM 算法训练后如何应用于实际的游戏中?
    110. 京东电商推荐系统实践
    111. < 机器学习实战 高清中英 源代码 > 分享
    112. 分布式锁用 Redis 还是 Zookeeper?
    113. InnoDB 事务与分布式事务中一些关键问题
    114. hello, 初次见面请多关注
    115. 【兼职】泽山贤教育招聘人工智能线上讲师,时薪 200-300 元
    116. ESearch: 58 搜索内核设计与实践—实时索引篇
    117. 两万字深度介绍分布式系统原理,一文入魂
    118. 推荐技术随谈
    119. 这是我读过写得最好的【秒杀系统架构】分析与实战!
    120. 如果这篇文章说不清 epoll 的本质,那就过来掐死我吧!
    121. 最完整的 Markdown 基础教程
    122. 番外篇:Lucene 索引流程与倒排索引实现
    123. Lucene 倒排索引原理探秘 (2)
    124. Lucene 倒排索引原理探秘 (1)
    125. 推荐系统:石器与青铜时代
    126. 快手 HBase 在千亿级用户特征数据分析中的应用与实践
    127. 数据老是错误,不知道为什么
    128. 怎么写代码呢
    129. 学习代码写作怎么写
    130. 学习数据代码
    131. 深度学习在 360 搜索广告 NLP 任务中的应用
    132. 消息中间件—RocketMQ 消息存储(二)
    133. 消息中间件—RocketMQ 消息存储(一)
    134. 消息中间件—RocketMQ 消息消费(三)(消息消费重试)
    135. 消息中间件—RocketMQ 消息消费(二)(push 模式实现)
    136. 消息中间件—RocketMQ 消息消费(一)
    137. 消息中间件—RocketMQ 消息发送
    138. 消息中间件—RocketMQ 的 RPC 通信(二)
    139. 消息中间件—RocketMQ 的 RPC 通信(一)
    140. (毕业真实版本)《马来西亚双威大学毕业证书 -|SUNWAY 毕业一模一样证书
    141. (毕业真实版本)《新加坡国立大学毕业证书 -|NUS 毕业一模一样证书
    142. 阿里零售通智能导购推荐技术实践
    143. “看一看”推荐模型揭秘!微信团队提出实时 Look-alike 算法,解决推荐系统多样性问题
    144. 关于机器学习归一化
    145. 网易新闻推荐:深度学习排序系统及模型
    146. 一镜到底:FM 们的原理及在贝壳搜索的实践
    147. 淘宝从几百到千万级并发的十四次架构演进之路!
    148. 分布式追踪系统概述及主流开源系统对比
    149. 系统架构系列(四):业务架构实战下篇
    150. 系统架构系列 (三):业务架构实战上篇
    151. 系统架构系列 (二):应对这一概念的方法
    152. 系统架构系列(一):如何用公式定义该概念?
    153. 写给开发者的谷歌技术面试终极通关指南
    154. 流式数据处理在百度数据工厂的应用与实践
    155. 一文读懂深度学习:从神经元到 BERT
    156. 基于内容的推荐算法
    157. Embedding 技术在民宿推荐中的应用
    158. XLNet : 运行机制及和 Bert 的异同比较
    159. 深度学习在 Airbnb 中的探索与应用
    160. 【贝壳智搜】标签:月老手中那一根根红线
    161. Xavier 论文疑惑(论文标题:Understanding the difficulty of training deep feedforward neural networks)
    162. TCP 报文格式高清图
    163. 从 Word Embedding 到 Bert 模型—自然语言处理中的预训练技术发展史
    164. Bert 时代的创新(应用篇):Bert 在 NLP 各领域的应用进展
    165. Netflix 推荐系统模型的快速线上评估方法——Interleaving
    166. 【真实生产案例】消息中间件如何处理消费失败的消息?
    167. YC 中国创始人陆奇:人工智能时代,芯片和底层软件基本都要重做
    168. 从 MySQL 高可用架构看高可用架构设计
    169. abtest- 数据分析 - 假设检验基础
    170. 程序员面试最常见问题 TOP 48
    171. abtest 那些事儿(下)—数据跟踪和效果评估
    172. list1 与 list2 求交集的方法总结!
    173. 当你打开天猫的那一刻,推荐系统做了哪些工作?
    174. 高并发架构消息队列面试题解析
    175. Embedding 在深度推荐系统中的 3 大应用方向
    176. 使用 ElasticSearch 的 44 条建议
    177. Elasticsearch 技术分析(七): Elasticsearch 的性能优化
    178. 适合程序员用的笔记本电脑
    179. 怎样写网站优化方案
    180. 马蜂窝 ABTest 多层分流系统的设计与实现
    181. ES 查询性能调优实践,亿级数据查询毫秒级返回
    182. 小米移动搜索中的 AI 技术
    183. LSTM 原理与实践,原来如此简单
    184. 基于 “ 滴滴 KDD 2018 论文:基于强化学习技术的智能派单模型 ” 再演绎
    185. 阿里妈妈:电商预估模型的发展与挑战
    186. Attention in RNN
    187. 详解 Transformer (Attention Is All You Need)
    188. SVM 优化出来支持向量点的不等式约束不等于 1 是为什么?
    189. 机器学习:K 折交叉验证的问题
    190. 滴滴基于 ElasticSearch 的一站式搜索中台实践
    191. 快手万亿级别 Kafka 集群应用实践与技术演进之路
    192. 微软 AB/Testing EXP 实验管理平台
    193. 揭开 YouTube 深度推荐系统模型 Serving 之谜
    194. 深度学习中不得不学的 Graph Embedding 方法
    195. 谷歌、阿里、微软等 10 大深度学习 CTR 模型最全演化图谱【推荐、广告、搜索领域】
    196. FTRL 公式推导
    197. 个性化推荐技术
    198. 分类模型与排序模型在推荐系统中的异同分析
    199. 阿里巴巴复杂搜索系统的可靠性优化之路
    200. 从 FFM 到 DeepFFM,推荐排序模型到底哪家强?
    201. 在 faster-RCNN 中,最后一层输出的 bbox_pred 是什么
    202. 有赞百亿级日志系统架构设计
    203. 打造工业级推荐系统(一):推荐算法工程师的成长之道
    204. 面试官:如果让你设计一个消息中间件,如何将其网络通信性能优化 10 倍以上?【石杉的架构笔记】
    205. 机器学习与深度学习常见面试题(上)
    206. ABtest 和假设检验、流量分配
    207. 【三. 推荐系统的必备要素 -2】ABtest 框架
    208. 复旦邱锡鹏教授公布《神经网络与深度学习》,中文免费下载
    209. 携程金融大数据风控算法实践
    210. 拯救 996 的配方
    211. 【一. 概述 -2】什么样的产品推荐效果明显
    212. 【一. 概述 -1】推荐系统简介
    213. 万字长文解读电商搜索——如何让你买得又快又好
    214. 【搜狐】新闻推荐系统的 CTR 预估模型
    215. 阿里妈妈新突破:深度树匹配如何扛住千万级推荐系统压力
    216. 计算广告中主要模块、策略及其场景(上篇)
    217. 有赞订单搜索 AKF 架构演进之路
    218. 独家解读 | 滴滴机器学习平台架构演进之路
    219. 前深度学习时代 CTR 预估模型的演化之路
    220. 知其然,知其所以然:基于多任务学习的可解释推荐系统
    221. [NAACL19] 一个更好更快更强的序列标注成分句法分析器
    222. 一直播千万量级用户推荐系统设计之路
    223. 知识图谱 |298 万条三元组生成方法 (一)
    224. AI 下一个拐点,图神经网络带来哪些机遇?
    225. 人脸识别如何快速工作
    226. 如何强化数据集中某个特征的影响?
    227. 强化学习系列二——应用 AlphaGo Zero 思路优化搜索排序
    228. 【58 同城】中文分词技术深度学习篇
    229. 一图胜千言: 解读阿里的 Deep Image CTR Model
    230. 推荐系统召回四模型之二:沉重的 FFM 模型
    231. Embedding 从入门到专家必读的十篇论文
    232. 深度 CTR 预估模型中的特征自动组合机制演化简史
    233. 详解 Airbnb 之深度学习在搜索业务的探索
    234. 万字长文带你解读 NLP 深度学习的各类模型
    235. 基于深度强化学习的新闻推荐模型 DRN
    236. 基于 Tensorflow 高阶 API 构建大规模分布式深度学习模型系列: 开篇
    237. 【贝壳网】贝壳搜索平台实时流总体架构设计
    238. 【贝壳网】贝壳搜索为什么能知道你想住哪?
    239. 百度中文纠错技术
    240. 版本控制工具——Git 常用操作
    241. 【贝壳网】ElasticSearch 相关性计算原理及实践
    242. 【贝壳网】Elasticsearch 在贝壳搜索的部署实践
    243. 【贝壳网】读“懂”用户找房需求:贝壳语义解析技术实践
    244. 【贝壳网】两种简单有效的标签选择方法
    245. 回顾 Facebook 经典 CTR 预估模型
    246. 主流 CTR 预估模型的演化及对比
    247. 推荐系统召回四模型之:全能的 FM 模型
    248. 自然语言处理基础:上下文词表征入门解读
    249. 为什么已有 Elasticsearch,我们还要重造实时分析引擎 AresDB?
    250. NLP 新秀 : BERT 的优雅解读
    251. 详解 Embeddings at Alibaba(KDD 2018)
    252. 前员工揭内幕:10 年了,为何谷歌还搞不定知识图谱?
    253. 人机交互式机器翻译研究与应用
    254. 独家揭秘:微博深度学习平台如何支撑 4 亿用户愉快吃瓜?
    255. 爱奇艺短视频软色情识别技术解析
    256. 卷积有多少种?一文读懂深度学习中的各种卷积
    257. 深度长文:中文分词的十年回顾
    258. 机器学习中如何处理不平衡数据?
    259. 【58 同城】语言模型及其应用
    260. 测试机器学习降维之线性判别模型 (LDA)
    261. GBDT+LR 算法解析及 Python 实现
    262. 网易杭研 分享 图数据库基础
    263. 用 Flink 取代 Spark Streaming,知乎实时数仓架构演进
    264. 国美 11·11:大促场景下的国美智能推荐系统演进之路
    265. 58 精准推送实践
    266. 《美团机器学习实践》—— 思维导图
    267. 「回顾」强化学习:原理与应用
    268. 详解 GAN 的谱归一化(Spectral Normalization)
    269. 「回顾」机器学习在反欺诈中应用
    270. 滴滴出行基于 RocketMQ 构建企业级消息队列服务的实践
    271. 一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC
    272. HBase 写吞吐场景资源消耗量化分析及优化
    273. Flink 在有赞实时计算的实践
    274. 语义分割江湖的那些事儿——从旷视说起
    275. 「回顾」百度智能写作如何通过人工智能技术为媒体内容创作赋能?
    276. 58 技术沙龙——云搜 知乎 58 同城 搜索架构
    277. 「回顾」基于金融智能风控的实时指标处理技术体系
    278. 「回顾」阿里妈妈:定向广告新一代点击率预估主模型——深度兴趣演化网络
    279. 深入剖析 Netty 源码设计(二)——BIO NIO AIO Reactor 模式到底干了啥
    280. 「机器学习基础与趋势」系列丛书最新成员:140 页《深度强化学习入门》发布
    281. 毕玄:我在阿里的十年技术感悟
    282. 使用 Pytorch 实现 skip-gram 的 word2vec
    283. 「回顾」蚂蚁数据分析平台的演进及数据分析方法的应用
    284. 「回顾」深度学习新技术在搜狗搜索广告中的深化应用
    285. Google 重叠实验框架:更多,更好,更快地实验
    286. 58 招聘推荐系统介绍——AB 实验框架
    287. 深入剖析 Netty 源码设计(一)——深入理解 select poll epoll 机制
    288. 从 KDD 2018 Best Paper 看 Airbnb 实时搜索排序中的 Embedding 技巧
    289. 中文分词技术及在 58 搜索的实践
    290. 58 搜索列表页连接效率优化实践
    291. 「回顾」58 同城 综合排序框架 连接效率优化实践
    292. 「行知」镶嵌在互联网技术上的明珠:漫谈深度学习时代点击率预估技术进展
    293. 推荐系统遇上深度学习 (二十九)-- 协同记忆网络理论及实践
    294. 推荐系统遇上深度学习 (二十八)-- 知识图谱与推荐系统结合之 MKR 模型原理及实现
    295. 推荐系统遇上深度学习 (二十七)-- 知识图谱与推荐系统结合之 RippleNet 模型原理及实现
    296. 推荐系统遇上深度学习 (二十六)-- 知识图谱与推荐系统结合之 DKN 模型原理及实现
    297. 推荐系统遇上深度学习 (二十五)-- 当知识图谱遇上个性化推荐
    298. 推荐系统遇上深度学习 (二十四)-- 深度兴趣进化网络 DIEN 原理及实战!
    299. 推荐系统遇上深度学习 (二十三)-- 大一统信息检索模型 IRGAN 在推荐领域的应用
    300. 推荐系统遇上深度学习 (二十二)–DeepFM 升级版 XDeepFM 模型强势来袭!
    301. 推荐系统遇上深度学习 (二十一)-- 阶段性回顾
    302. 推荐系统遇上深度学习 (二十)-- 贝叶斯个性化排序(BPR) 算法原理及实战
    303. 推荐系统遇上深度学习 (十九)-- 探秘阿里之完整空间多任务模型 ESSM
    304. 推荐系统遇上深度学习 (十八)-- 探秘阿里之深度兴趣网络(DIN) 浅析及实现
    305. 推荐系统遇上深度学习 (十七)-- 探秘阿里之 MLR 算法浅析及实现
    306. 推荐系统遇上深度学习 (十六)-- 详解推荐系统中的常用评测指标
    307. 推荐系统遇上深度学习 (十五)-- 强化学习在京东推荐中的探索
    308. 推荐系统遇上深度学习 (十四)–《DRN:A Deep Reinforcement Learning Framework for News Recommendation》
    309. 推荐系统遇上深度学习 (十三)–linUCB 方法浅析及实现
    310. 推荐系统遇上深度学习 (十二)-- 推荐系统中的 EE 问题及基本 Bandit 算法
    311. 大众点评搜索基于知识图谱的深度学习排序实践
    312. 推荐系统遇上深度学习 (十)–GBDT+LR 融合方案实战
    313. 推荐系统遇上深度学习 (八)–AFM 模型理论和实践
    314. 推荐系统遇上深度学习 (七)–NFM 模型理论和实践
    315. 推荐系统遇上深度学习 (六)–PNN 模型理论和实践
    316. 推荐系统遇上深度学习 (五)–Deep&Cross Network 模型理论和实践
    317. 推荐系统遇上深度学习 (四)-- 多值离散特征的 embedding 解决方案
    318. 推荐系统遇上深度学习 (三)–DeepFM 模型理论和实践
    319. 深度学习时代的图模型
    320. 推荐系统遇上深度学习 (二)–FFM 模型理论和实践
    321. 推荐系统遇上深度学习 (一)–FM 模型理论和实践
    322. BERT 大火却不懂 Transformer?读这一篇就够了
    323. 图解当前最强语言模型 BERT:NLP 是如何攻克迁移学习的?
    324. AutoML 在推荐系统中的应用
    325. 一朝爆发?解读知识图谱和图数据库的 2018
    326. 工作中组内遇到的 elasticsearch 使用上的踩坑总结
    327. 深度好文:2018 年 NLP 应用和商业化调查报告
    328. 深度学习在金融文本情感分类中的应用
    329. 深入剖析 ReentrantLock 公平锁与非公平锁源码实现
    330. 算法工程师必须要知道的面试技能雷达图
    331. 美团深度学习在搜索业务中的探索与实践
    332. 回顾·搜索引擎算法体系简介——排序和意图篇
    333. 基于知识图谱的问答系统入门—NLPCC2016KBQA 数据集
    334. 【干货】Kafka 数据可靠性深度解读
    335. 回顾·CTR 预估系统实践
    336. 「回顾」强化学习在自然语言处理中的应用
    337. Spark 宽依赖 窄依赖 Job Stage Executor Task 总结
    338. Spark 性能调优总结
    339. Scala 下划线 (_) 用法汇总
    340. 【干货】Spark 之性能优化
    341. 《搜索与推荐中的深度学习匹配》之推荐篇
    342. 《搜索与推荐中的深度学习匹配》之搜索篇
    343. 「回顾」Yoo 视频底层页推荐系统 - 从 0 到 1 的实践
    344. 吴恩达、Yann LeCun 等大佬回顾预测 2019 年 AI 发展
    345. 蚂蚁金服核心技术:百亿特征实时推荐算法揭秘
    346. Numerical Coordinate Regression= 高斯热图 VS 坐标回归
    347. 「回顾」AI 如何让广告投放进入“自动驾驶”?
    348. 随机变量 - 统计学核心方法及其应用
    349. 简单聊聊特征工程
    350. 近期知识图谱顶会论文推荐,你都读过哪几篇?
    351. 半监督深度学习小结:类协同训练和一致性正则化
    352. 「回顾」机器学习与推荐系统实践
    353. 全文搜索引擎,选 ElasticSearch 还是 Solr?
    354. NLP-BERT 谷歌自然语言处理模型:BERT- 基于 pytorch
    355. 罗振宇 2018“时间的朋友”跨年演讲未删减全文
    356. 机器学习与数据科学决策树指南
    357. 「回顾」旅游知识图谱的构建和应用
    358. 「回顾」知乎推荐页 Ranking 经验分享
    359. 计算广告论文及资料 && 推荐系统论文及资料 && 基于 Spark 的 CTR 模型资料
    360. 万物皆 Embedding,从经典的 word2vec 到深度学习基本操作 item2vec
    361. 【下】YouTube 深度学习推荐系统的十大工程问题
    362. 【上】重读 Youtube 深度学习推荐系统论文,字字珠玑,惊为神文
    363. 人脸分析:数据时代的“面像学” 一文读懂用户画像的前世今生
    364. 「回顾」爱奇艺搜索排序模型迭代之路
    365. 「回顾」NLP 在网络文学领域的应用
    366. 清华大学图神经网络综述:模型与应用
    367. Netty 学习和进阶策略
    368. Flink 实战: 结合 Kafka 构建端到端的 Exactly-Once 处理程序
    369. Apache Flink 端到端(end-to-end)Exactly-Once 特性概览 (翻译)
    370. 《提问的智慧》中文版翻译
    371. NIPS2018 | 腾讯 AI Lab 入选 20 篇论文,含 2 篇 Spotlight
    372. 【翻译】Redis 存储揭秘
    373. 大话 Select、Poll、Epoll 机制
    374. 空间数据索引 RTree 完全解析及 Java 实现
    375. 建了个机器学习与深度学习的微信群
    376. 【美团】LruCache 在美团 DSP 系统中的应用演进
    377. 【美团】深入浅出排序学习:写给程序员的算法系统开发实践
    378. 基于 Flink 的严选实时数仓实践
    379. 百页机器学习书
    380. 基于对象特征的推荐系统
    381. 「回顾」让机器读懂人类:揭秘机器阅读理解技术及应用
    382. “IT 男等级”对照表|找找你在哪?
    383. 两位拯救谷歌的超级工程师的故事:计算机界最好的结对编程榜样
    384. 机器学习在美团配送系统的实践:用技术还原真实世界
    385. [译] 支持向量机(SVM)教程
    386. YouTube 推荐系统改进之路
    387. 「干货」YouTube 基于深度神经网络推荐系统剖析
    388. 实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程
    389. 【 DataFunTalk】HBase RowKey 与索引设计
    390. 架构拆分原理解析
    391. 阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景
    392. 我收到了斯坦福、UCL、CMU、NYU、UW 的博士 offer,这是我的经验
    393. BigGAN 论文解读
    394. 微软专家眼中个性化推荐系统的 5 大研究趋势
    395. 理解五个基本概念,让你更像机器学习专家
    396. 阿里巴巴搜索引擎平台 Ha3 揭秘
    397. Java 编程方法论之响应式编程系列视频
    398. 每日生产万亿消息数据入库,腾讯如何突破大数据分析架构瓶颈
    399. 这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
    400. 菜鸟,下一代分布式体系架构的设计理念
    401. 除了抖音和头条,字节跳动的 AI 实力有多强?
    402. 阿里妈妈大规模在线分层实验实践
    403. 深度学习在 Airbnb 大规模搜索排名上的实战经验
    404. 51 信用卡的个性化推荐体系
    405. 【杉枫】科技与人文
    406. 【杉枫】架构抽象化设计
    407. 机器学习人工智能学习资源导航
    408. 这里好冷清
    409. 苏宁 11.11:一种基于神经网络的智能商品税分类系统
    410. 有赞搜索引擎从 0 到 1 技术解析
    411. 人工智能大佬社区
    412. 苏宁 11.11 :苏宁大数据离线任务开发调度平台实践
    413. 苏宁 11.11:苏宁易购订单搜索系统架构及实现
    414. 苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用
    415. 美团大脑:知识图谱的建模方法及其应用
    416. 【干货】搜索引擎技术资料整理
    417. 2143 亿!2018 年天猫“双 11”成交总额是这样预测的
    418. 一文看懂智能合约的现状与未来
    419. “搜你所想”之用户搜索意图识别
    420. 【杉枫】推荐引擎异步架构设计
    421. 苏宁 11.11:仓库内多 AGV 协作的全局路径规划算法研究
    422. Kafka 设计解析(一):Kafka 背景及架构介绍
    423. 「回顾」饿了么推荐算法演进及在线学习实践
    424. Lucene 6 数值索引以及空间索引方案
    425. 互联网架构,究竟为啥要做服务化?
    426. Lucene 倒排索引缓冲池的细节
    427. 【译】写给计算机专业毕业生的 22 条宝贵建议
    428. 深度学习在序列化推荐中的应用 (1)-GRU4REC 以及扩展
    429. 实时翻译的发动机:矢量语义(斯坦福大学课程解读)
    430. 骚操作!电影接吻镜头次数的算法实现
    431. 响应式编程 Rxjava 书籍视频教程
    432. 机器学习,模式识别,数据挖掘常用学习资源链接
    433. 美团深度学习系统的工程实践