圆月山庄资源网 Design By www.vgjia.com
通过百度云API接口抽取得到产品评论的观点,也掠去了很多评论中无用的内容以及符号,为后续进行文本主题挖掘或者规则的提取提供基础。
工具
1、百度云账号,申请应用接口(自然语言处理)
2、python3.5
以下是百度接口提供的说明:
我们使用到的可选值是13,kindle属于3C产品。
下面是代码示例:
from aip import AipNlp import csv import pandas as pd from pandas.core.frame import DataFrame """ 你的 APPID AK SK """ APP_ID = '********' API_KEY = '********' SECRET_KEY = '********' client = AipNlp(APP_ID, API_KEY, SECRET_KEY) # 导入评论数据文件,并找到第13列(12行)的评论内容提取出来 def output(): urls = [] with open('E:\\tb_iphone8.csv', "r") as f: reader = csv.reader(f) for row in reader: urls.append(row[12]) return urls # 通过百度云提供的API对评论观点进行提取 def commentTag(): x = output() all={} abst='' for i in range(10560): text=x[i] """ 调用评论观点抽取 """ """ 如果有可选参数 """ # 可选参数为13表示利用了3C产品的语料库 options = {} options["type"] = 13 """ 带参数调用评论观点抽取 """ result=client.commentTag(text, options) print(result) if "error_code" in result.keys(): abst+='' all['abstract'] = abst else: data = result['items'] items = data[0] abst += items['abstract'] all['abstract'] = abst return abst if __name__ == '__main__': ALL=commentTag() print(ALL)
得到的结果如下:
可以看到,现在抽取出来的评论部分内容都是具有一定观点倾向的,大部分没有什么含义的评论内容已经被除去,这对后面的分析有一定的帮助。
以上这篇对python借助百度云API对评论进行观点抽取的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
圆月山庄资源网 Design By www.vgjia.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
圆月山庄资源网 Design By www.vgjia.com
暂无评论...
更新日志
2024年11月06日
2024年11月06日
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]