当前位置 博文首页 > Django对接elasticsearch实现全文检索的示例代码

    Django对接elasticsearch实现全文检索的示例代码

    作者:劲风君 时间:2021-09-19 18:33

    目录
    • 前言
    • 第一步:首先安装相关的依赖包
    • 第二步:在django项目配置文件settings.py中注册应用
    • 第三步:在django项目配置文件settings.py中指定搜索的后端
    • 第四步:创建索引类
    • 第五步:在templates目录中创建text字段使用的模板文件
    • 第六步:手动更新索引
    • 第七步:创建haystack序列化器
    • 第八步:创建视图类
    • 第九步:添加路由
    • 第十步:结果

    前言

    说到搜索,第一时间想到的是mysql数据库的like语句

    但是,假如你的数据库有几千万条数据,name字段没有索引,可能查询需要十几分钟,用户可能会等你?那为什么不给name字段增加索引?数据表不仅仅是用来查询,也会经常修改数据,新增删除数据等。建立索引后,做增删改操作时也会大大占用数据库资源。所以应该怎么解决呢?

    Elasticsearch!

    一个强大的基于Lucene的全文搜索服务器!维基百科、Stack Overflow、Github都在用。

    如果想详细了解其原理的话,可以参考:https://www.elastic.co/guide/index.html

    第一步:首先安装相关的依赖包

    pip install drf-haystack 
    pip install elasticsearch 
    pip install djangorestframework
    

    第二步:在django项目配置文件settings.py中注册应用

    INSTALLED_APPS = 
    [
    'app.apps.AppConfig', 
    'haystack', 
    'rest_framework'
    ]
    

    第三步:在django项目配置文件settings.py中指定搜索的后端

    HAYSTACK_CONNECTIONS = { 
    'default':    {
                'ENGINE':'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine', 
                'URL': 'http://127.0.0.1:9200/', # 此处为elasticsearch运行的服务器ip地址,端口号固定为9200 
                'INDEX_NAME': 'test', # 指定elasticsearch建立的索引库的名称 
                }, 
                } 
    # 当添加、修改、删除数据时,自动生成索引 
    HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' 
    # 指定搜索结果每页的条数 
    # HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1
    

    第四步:创建索引类

    在此之前要先创建model类,并插入数据

    from django.db import models 
    class Es(models.Model): 
        name=models.CharField(max_length=32)
        desc=models.CharField(max_length=32)
    

    在需要进行索引的应用的目录下创建文件search_indexes.py, 在该文件内创建该索引类
    我在app应用下创建:search_indexes.py

    # 索引模型类的名称必须是 模型类名称 + Index 
    from haystack import indexes 
    from .models import Es 
    class EsIndex(indexes.SearchIndex, indexes.Indexable): 
        text = indexes.CharField(document=True, use_template=True) 
        def get_model(self): 
        """返回建立索引的模型类""" 
            return Es 
        def index_queryset(self, using=None): 
        """返回要建立索引的数据查询集""" 
            return self.get_model().objects.all()
    

    第五步:在templates目录中创建text字段使用的模板文件

    创建文件templates/search/indexes/app/es_text.txt文件中定义

    {{ object.name }} 
    {{ object.desc }}

    第六步:手动更新索引

    python manage.py rebuild_index   #数据库有多少条数据,全部会被同步到es中
    

    第七步:创建haystack序列化器

    from drf_haystack.serializers 
    import HaystackSerializer 
    from rest_framework.serializers 
    import ModelSerializer from app 
    import models 
    from app.search_indexes import EsIndex 
    class EsSerializer(ModelSerializer): 
        class Meta: 
            model=models.Es 
            fields='__all__' 
    class EsIndexSerializer(HaystackSerializer): 
         object = EsSerializer(read_only=True) # 只读,不可以进行反序列化 
         class Meta: 
            index_classes = [EsIndex]# 索引类的名称 
            fields = ('text', 'object')# text 由索引类进行返回, object 由序列化类进行返回,第一个参数必须是text
    

    第八步:创建视图类

    from drf_haystack.viewsets 
    import HaystackViewSet 
    from app.models import Book 
    from app.serializers import EsIndexSerializer 
    class EsSearchView(HaystackViewSet): 
        index_models = [Es] 
        serializer_class = EsIndexSerializer
    

    第九步:添加路由

    from django.conf.urls 
    import url from django.contrib 
    import admin 
    from rest_framework import routers 
    from app.views import EsSearchView 
        router = routers.DefaultRouter() 
        router.register("book/search", EsSearchView, base_name="book-search") 
        urlpatterns = [ url(r'^admin/', admin.site.urls), ] 
        urlpatterns += router.urls
    

    第十步:结果

    http://127.0.0.1:8000/?text=测试

    jsjbwy
    下一篇:没有了