当前位置 博文首页 > 舒哥的blog:搜索,推荐,广告系统架构及算法技术资料大合集吐血
你还在为学习算法摸不着头脑么?你还在为技术调研各种Google么?AI的牛b吹不上去?盯紧了,这里就是你的2020女朋友~。本项目会持续关注AI落地的一些优质技术资料。大家也可以去网站投稿。
算法学习资料: AI_Tutorial 记得Star哦~!
后端架构、AI架构、搜索系统、推荐系统、广告系统技术资料整理。这篇文章意图是收集市面上质量不错的后端架构、AI架构、搜索、 推荐、 广告引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(AIQ 、infoQ、Stackoverflow、github 等、国内外知名互联网公司技术博客(阿里中间件团队博客、美团技术博客等)、知名技术牛人公众号博客等。
以下整理的内容大致根据来源进行分类。@AIQ-人工智能
github地址:https://github.com/cbamls/full_stack_coder
个人视角有限,谢谢。
Lucene 官网
Lucene 7.6.0源码
Lucene Wiki
索引结构 -Lucene6.6.0
Solr 官网
Solr Wiki
Elastic 官网
Elastic Blog
Elastic Formus
Elasticsearch: 权威指南 - 中文版
Elastic 中文社区
LucidWorks
LucidWorks Blog
ansj 分词
HanLP 分词
ES-Analysis-IK
天猫推荐算法团队的那些事儿 - 20140401 - infoQ
本文以访谈的方式呈现,对搜索和推荐算法进行了简单的比较,提到了 AB 测试和离线测试,主要对推荐算法团队的工作方式、工作考评、任务分配、招聘等进行了介绍。
天猫 11.11:搜索引擎实时秒级更新 - 20141111 - infoQ
文章简单介绍了阿里搜索引擎架构,提到了以下内容:1)为提高数据实时性(库存、价格等),去掉应用层和业务层的缓存,重点提升引擎层的服务能力。2)排序链,根据业务场景定制排序链。3)sku 搜索,搜索结果和属性导航联动(标类产品)。
阿里搜索离线技术团队负责人谈 Hadoop:阿里离线平台、YARN 和 iStream
基于 Apache Flink 的实时计算引擎 Blink 在阿里搜索中的应用 - 20170216 - infoQ
阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景 - 20181128 - AIQ
阿里巴巴搜索引擎平台 Ha3 揭秘 - 201811 - AIQ
阿里搜索事业部技术团队
阿里集团搜索、推荐、图像技术的大本营,大数据时代的创新主场。
阿里搜索事业部技术团队
OpenSearch:轻松构建大数据搜索服务 - 20160222
搜索双链路实时计算体系 @双 11 实战 - 20160111
阿里中间件团队博客
2012 年期间,阿里中间件博客记录了 20 多篇 Lucene、Solr 相关博文,主要记录了一些在项目开发过程中遇到的问题,以及部分源码解读。内容丰富、实用,但不是很系统。
阿里中间件团队博客
Solr 调优参考 - 20120521
Solr Lucene 优劣势分析 - 20120626
SolrQuery 性能压测参考 - 20120731
NumericField NumericRangeQuery 原理分析 - 20120731
Solr schema 编写指导 - 20120731
关于搜索挖掘所想 - 20120731
SolrQuery 挖掘 – 单维度聚合分析 - 20120920
我感受到的排序机制参考 - 20120920
垂直搜索新问题 - 20120920
Solr 平台化搜索实战必知场景 - 20120921
Solr Schema 配置小细节大问题 - 20121015
Solr DisjunctionMax 注解 - 20121015
Sql Support within Solr- 类 Sql 的 solr 搜索实现 (1) - 20121015
Sql Support within Solr- 类 Sql 的 solr 搜索实现 (2) - 20121015
关于 TrieField 的全面认识、理解、运用 - 20121015
Solr Facet 引发思考 on the road - 20121029
查询问题 —queryparse 深入理解 - 20121029
TermRangeQuery 源码解析 - 20121106
Solr 之缓存篇 - 20121106
搜索的测试话题 - 20121113
关于搜索夜话 ---- 作为阶段序列的告别 - 20121113
solr 长文本搜索问题 - 20121210
SolrCore2.9.1 源码分析备忘 - 20121210
京东 618:揭秘大促销背后的个性化推荐 - 20150618 - infoQ
京东 11.11:商品搜索系统架构设计 - 20151111 - infoQ
京东 618:机器学习与商品数据挖掘和知识抽取 - 20170618 - infoQ
美团点评技术团队博客
在国内互联网公司中,个人认为“美团点评技术团队博客”是最持之以恒的,而且非常干货。
美团点评技术团队
美团 O2O 排序解决方案——线下篇 - 20151207
美团O2O排序解决方案——线上篇 - 2015-11-16 17:00
美团点评旅游搜索召回策略的演进 - 20170616 - AIQ
搜狗搜索广告检索系统 - 弹性架构演进之路 - 20160111 - infoQ
深度学习在搜狗无线搜索广告中的应用 - 20160808 - infoQ
以搜狗为例,谈语音输入如何影响你的生活 - 20161208 - infoQ
1 号店 11.11:分布式搜索引擎的架构实践 - 20151112 - infoQ
1 号店 11.11:机器排序学习在电商搜索中的实战 - 20161111 - AIQ
机器学习在 1 号店商品匹配中的实践 - 20170506 - 携程技术中心
国内
当当 11.11:促销系统与交易系统的重构实践 - 20151113 - infoQ
苏宁易购 11.11:商品详情系统架构设计 - 20151227 - infoQ
达观数据 点击模型:提升算法精度的利器 - 20160315 - infoQ
达观数据 一个可供参考的搜索引擎排序架构实践案例 - 20160830 - infoQ
达观数据 “搜你所想” 之用户搜索意图识别 - 20170608 - AIQ
链家网 数据驱动在搜索优化与推荐策略中的实践 - 20170406 - infoQ
深度学习在 Airbnb 大规模搜索排名上的实战经验 - 20181118 - AIQ
51 信用卡的个性化推荐体系 - 2018 - AIQ
苏宁 11.11:搜索引擎 Solr 在苏宁易购商品评价系统中的应用 - 20181105 - AIQ
国外
Twitter 实时检索 6700 亿条推文,细谈 Twitter 搜索引擎的演进历程 - 20160330 - infoQ
Yelp 是如何用数据驱动搜索过滤器的? - 20151209 - infoQ
我爱自然语言处理 推荐
漫话中文自动分词和语义识别
刘超觉先 详细分析了 Lucene3.x 的源码,推荐。
Anatomy of an Elasticsearch Cluster: Part I
Anatomy of an Elasticsearch Cluster: Part II
Anatomy of an Elasticsearch Cluster: Part III
Stackoverflow - Lucene
Stackoverflow - Solr
Stackoverflow - Elastic
对话 Kibana 之父:如果需要,你应该自己动手编写工具 - 20170111 - infoQ
配置高性能 Elasticsearch 集群的 9 个小贴士 - 20170104 - infoQ
基于 ElasticStack 的数据探索与分析 - 20161018 - infoQ
使用 Akka、Kafka 和 ElasticSearch 等构建分析引擎 - 20160825 - infoQ
万亿级日志与行为数据存储查询技术剖析 - 20170222 - infoQ
谷歌的自然语言部门是啥样的? - 20160118 - infoQ
通过 Baratine 将 Lucene 库暴露为微服务 - 20160225 - infoQ