当前位置 博文首页 > LY的博客:使用PYTHON将上百个TXT文件提取其中信息生成一个csv

    LY的博客:使用PYTHON将上百个TXT文件提取其中信息生成一个csv

    作者:[db:作者] 时间:2021-08-09 18:50

    原文件目录如图

    只把他们合并成一个txt没到到自己的需要,我需要做成一个如图所示的csv文件,以上传服务器生成文章

    ?

    ?

    ?

    ?

    上代码:

    #coded by伊玛目的门徒 多个txt提取关键信息生成csv
    #coding=utf-8
    import os
    import pandas as pd
    #获取目标文件夹的路径
    filedir = os.getcwd()+''
    #获取当前文件夹中的文件名称列表
    filenames=os.listdir(filedir)
    #打开当前目录下的result.txt文件,如果没有则创建
    post_title=[]
    post_content=[]
    post_post_author=[]
    post_date=[]
    post_date_gmt=[]
    post_status=[]
    comment_status=[]
    post_name=[]
    post_modified=[]
    post_modified_gmt=[]
    guid=[]
    menu_order=[]
    post_type=[]
    comment_count=[]
    post_parent=[]
    
    i=0
    #先遍历文件名
    for filename in filenames:
        i+=1
        print(i)
    
        if i>0:
            filepath = filedir+'\\'+filename
            print(filepath[:-4])
            post_title.append(filename[:-4])
    
            g=open(filepath,encoding='gbk', errors='ignore')
    
            content=g.read()
            post_content.append(content)
    
            post_post_author.append('1')
            post_date.append('2019-10-13 14:04:59')
            post_date_gmt.append('2019-10-13 14:02:59')
            post_status.append('publish')
            comment_status.append('open')
            post_name.append('%e4%b8%ad%e5%9b%bd%e9%82%ae%e6%94%bf%e5%82%a8%e8%93%84%e9%93%b6%e8%a1%8c%e6%9c%89%e9%99%90%e8%b4%a3%e4%bb%bb%e5%85%ac%e5%8f%b8%e6%b9%96%e5%8c%97%e7%9c%81%e5%8d%81%e5%a0%b0%e5%b8%82%e4%b8%b9%e6%b1%9f')
            post_modified.append('2019-10-13 14:06:59')
            post_modified_gmt.append('2019-10-13 14:01:40')
            guid.append('http://www.lianhanghao.xyz/quantstrategy/'+str (i+1))
            menu_order.append('0')
            post_type.append('post')
            comment_count.append('0')
            post_parent.append('0')
    
    
    
    print (post_title)
    print (post_content[2])
    
    
    df=pd.DataFrame({'post_title':post_title,
                     'post_content':post_content,
                     'post_post_author':post_post_author,
                     'post_date':post_date,
                     'post_date_gmt':post_date_gmt,
                     'post_status':post_status,
                     'post_name':post_name,
                     'post_modified':post_modified,
                     'post_modified_gmt':post_modified_gmt,
                     'guid':guid,
                     'menu_order':menu_order,
                     'post_type':post_type,
                     'comment_count':comment_count,
                    'post_parent':post_parent,
                     'comment_status':comment_status
    
                     })
    print (df)
    df.to_csv("./output.csv",encoding='utf_8_sig')
    print ('########导出完成############')
    

    演示视频:

    https://www.bilibili.com/video/av71094512/

    ?

    ?

    ?

    cs