成人性生交大片免费看视频r_亚洲综合极品香蕉久久网_在线视频免费观看一区_亚洲精品亚洲人成人网在线播放_国产精品毛片av_久久久久国产精品www_亚洲国产一区二区三区在线播_日韩一区二区三区四区区区_亚洲精品国产无套在线观_国产免费www

主頁 > 知識庫 > 用Python實現網易云音樂的數據進行數據清洗和可視化分析

用Python實現網易云音樂的數據進行數據清洗和可視化分析

熱門標簽:西藏房產智能外呼系統(tǒng)要多少錢 外呼并發(fā)線路 宿遷星美防封電銷卡 百度地圖標注沒有了 ai電銷機器人源碼 長沙高頻外呼系統(tǒng)原理是什么 地圖標注審核表 ai電話機器人哪里好 湛江智能外呼系統(tǒng)廠家

Python實現對網易云音樂的數據進行一個數據清洗和可視化分析

對音樂數據進行數據清洗與可視化分析

關于數據的清洗,實際上在上一一篇文章關于抓取數據的過程中已經做了一部分,后面我又做了一下用戶數據的抓取

歌曲評論:

包括后臺返回的空用戶信息、重復數據的去重等。除此之外,還要進行一些清洗:用戶年齡錯誤、用戶城市編碼轉換等。

關于數據的去重,評論部分可以以sommentId為數據庫索引,利用數據庫來自動去重;用戶信息部分以用戶ID為數據庫索引實現自動去重。

API返回的用戶年齡一般是時間戳的形式(以毫秒計)、有時候也會返回一個負值或者一個大于當前時間的值,暫時沒有找到這兩種值代表的含義,故而一律按0來處理。

API返回的用戶信息中,城市分為province和city兩個字段,本此分析中只保存了city字段。實際上字段值是一個城市code碼,具體對照在這里下載。
利用Python的數據處理庫pandas進行數據處理,利用可視化庫pyecharts進行數據可視化。

分別查看下面分析結果。

  • 評論用戶年齡分布
  • 評論關鍵詞分布
  • 評論時間數量分布(年-月)
  • 評論時間數量分布(年-月-日)

對音樂數據進行數據清洗與可視化分析

import pandas as pd
import pymysql
from pyecharts import Bar,Pie,Line,Scatter,Map
TABLE_COMMENTS = '****'
TABLE_USERS = '****'
DATABASE = '****'
conn = pymysql.connect(host='localhost', user='****', passwd='****', db=DATABASE, charset='utf8mb4')
sql_users = 'SELECT id,gender,age,city FROM '+TABLE_USERS
sql_comments = 'SELECT id,time FROM '+TABLE_COMMENTS
comments = pd.read_sql(sql_comments, con=conn)
users = pd.read_sql(sql_users, con=conn)
# 評論時間(按天)分布分析
comments_day = comments['time'].dt.date
data = comments_day.id.groupby(comments_day['time']).count()
line = Line('評論時間(按天)分布')
line.use_theme('dark')
line.add(
	'',
	data.index.values,
	data.values,
	is_fill=True,
)
line.render(r'./評論時間(按天)分布.html')
# 評論時間(按小時)分布分析
comments_hour = comments['time'].dt.hour
data = comments_hour.id.groupby(comments_hour['time']).count()
line = Line('評論時間(按小時)分布')
line.use_theme('dark')
line.add(
	'',
	data.index.values,
	data.values,
	is_fill=True,
)
line.render(r'./評論時間(按小時)分布.html')
# 評論時間(按周)分布分析
comments_week = comments['time'].dt.dayofweek
data = comments_week.id.groupby(comments_week['time']).count()
line = Line('評論時間(按周)分布')
line.use_theme('dark')
line.add(
	'',
	data.index.values,
	data.values,
	is_fill=True,
)
line.render(r'./評論時間(按周)分布.html')
# 用戶年齡分布分析
age = users[users['age']>0]	# 清洗掉年齡小于1的數據
age = age.id.groupby(age['age']).count()	# 以年齡值對數據分組
Bar = Bar('用戶年齡分布')
Bar.use_theme('dark')
Bar.add(
	'',
	age.index.values,
	age.values,
	is_fill=True,
)
Bar.render(r'./用戶年齡分布圖.html')	# 生成渲染的html文件
# 用戶地區(qū)分布分析
# 城市code編碼轉換
def city_group(cityCode):
    city_map = {
        '11': '北京',
        '12': '天津',
        '31': '上海',
        '50': '重慶',
        '5e': '重慶',
        '81': '香港',
        '82': '澳門',
        '13': '河北',
        '14': '山西',
        '15': '內蒙古',
        '21': '遼寧',
        '22': '吉林',
        '23': '黑龍江',
        '32': '江蘇',
        '33': '浙江',
        '34': '安徽',
        '35': '福建',
        '36': '江西',
        '37': '山東',
        '41': '河南',
        '42': '湖北',
        '43': '湖南',
        '44': '廣東',
        '45': '廣西',
        '46': '海南',
        '51': '四川',
        '52': '貴州',
        '53': '云南',
        '54': '西藏',
        '61': '陜西',
        '62': '甘肅',
        '63': '青海',
        '64': '寧夏',
        '65': '新疆',
        '71': '臺灣',
        '10': '其他',
    }
    return city_map[cityCode[:2]]
city = users['city'].apply(city_group)
city = city.id.groupby(city['city']).count()
map_ = Map('用戶地區(qū)分布圖')
map_.add(
	'',
	city.index.values,
	city.values,
	maptype='china',
	is_visualmap=True,
	visual_text_color='#000',
	is_label_show=True,
)
map_.render(r'./用戶地區(qū)分布圖.html')

可視化結果



評論時間按周分布圖可以看出,評論數在一周當中前面較少,后面逐漸增多,這可以解釋為往后接近周末,大家有更多時間來聽聽歌、刷刷歌評,而一旦周末過完,評論量馬上下降(周日到周一的下降過渡),大家又回歸到工作當中。


評論時間按小時分布圖可以看出,評論數在一天當中有兩個小高峰:11點-13點和22點-0點。這可以解釋為用戶在中午午飯時間和晚上下班(課)在家時間有更多的時間來聽歌刷評論,符合用戶的日常。至于為什么早上沒有出現一個小高峰,大概是早上大家都在搶時間上班(學),沒有多少時間去刷評論。

https://blog.csdn.net/u011371360

用戶年齡分布圖可以看出,用戶大多集中在14-30歲之間,以20歲左右居多,除去虛假年齡之外,這個年齡分布也符合網易云用戶的年齡段。圖中可以看出28歲有個高峰,猜測可能是包含了一些異常數據,有興趣的化可以做進一步分析。


用戶地區(qū)分布圖可以看出,用戶涵蓋了全國各大省份,因為中間數據(坑)的缺失,并沒有展現出哪個省份特別突出的情況。對別的歌評(完全數據)的可視化分析,可以看出明顯的地區(qū)分布差異。

此次分析只是對某一首歌曲評論時間、用戶年齡/地區(qū)分布進行的,實際上抓取到的信息不僅僅在于此,可以做進一步分析(比如利用評論內容進行文本內容分析等),這部分,未來會進一步分析。當然也可以根據自己情況對不同歌曲進行分析。

歌詞文本分析

情感分析采用Python的文本分析庫snownlp,代碼如下:

import numpy as np
import pymysql
from snownlp import SnowNLP
from pyecharts import Bar
TABLE_COMMENTS = '****'
DATABASE = '****'
SONGNAME = '****'
def getText():
	conn = pymysql.connect(host='localhost', user='root', passwd='root', db=DATABASE, charset='utf8')
	sql = 'SELECT id,content FROM '+TABLE_COMMENTS
	text = pd.read_sql(sql%(SONGNAME), con=conn)
	return text
def getSemi(text):
	text['content'] = text['content'].apply(lambda x:round(SnowNLP(x).sentiments, 2))
	semiscore = text.id.groupby(text['content']).count()
	bar = Bar('評論情感得分')
	bar.use_theme('dark')
	bar.add(
		'',
		y_axis = semiscore.values,
		x_axis = semiscore.index.values,
		is_fill=True,
	)
	bar.render(r'情感得分分析.html')
	text['content'] = text['content'].apply(lambda x:1 if x>0.5 else -1)
	semilabel = text.id.groupby(text['content']).count()
	bar = Bar('評論情感標簽')
	bar.use_theme('dark')
	bar.add(
		'',
		y_axis = semilabel.values,
		x_axis = semilabel.index.values,
		is_fill=True,
	)
	bar.render(r'情感標簽分析.html')

結果:


詞云生成采用jieba分詞庫分詞,wordcloud生成詞云,代碼如下:

from wordcloud import WordCloud
import matplotlib.pyplot as plt
plt.style.use('ggplot')
plt.rcParams['axes.unicode_minus'] = False
def getWordcloud(text):
	text = ''.join(str(s) for s in text['content'] if s)
	word_list = jieba.cut(text, cut_all=False)
	stopwords = [line.strip() for line in open(r'./StopWords.txt', 'r').readlines()]	# 導入停用詞
	clean_list = [seg for seg in word_list if seg not in stopwords] #去除停用詞
	clean_text = ''.join(clean_list)
	# 生成詞云
	cloud = WordCloud(
	    font_path = r'C:/Windows/Fonts/msyh.ttc',
	    background_color = 'white',
	    max_words = 800,
	    max_font_size = 64
	)
	word_cloud = cloud.generate(clean_text)
	# 繪制詞云
	plt.figure(figsize=(12, 12))
	plt.imshow(word_cloud)
	plt.axis('off')
	plt.show()
if __name__ == '__main__':
	text = getText()
	getSemi(text)
	getWordcloud(text)

總結

本篇文章就到這里了,希望能給你帶來幫助,也希望您能夠多多關注腳本之家的更多內容!

您可能感興趣的文章:
  • Python爬蟲實戰(zhàn)之網易云音樂加密解析附源碼

標簽:海南 南平 普洱 林芝 漯河 盤錦 寧夏 大同

巨人網絡通訊聲明:本文標題《用Python實現網易云音樂的數據進行數據清洗和可視化分析》,本文關鍵詞  用,Python,實現,網易,云,音,;如發(fā)現本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《用Python實現網易云音樂的數據進行數據清洗和可視化分析》相關的同類信息!
  • 本頁收集關于用Python實現網易云音樂的數據進行數據清洗和可視化分析的相關信息資訊供網民參考!
  • 推薦文章
    亚洲精品乱码久久久久久9色| 国产精品一区二区免费福利视频| av无码久久久久久不卡网站| 欧美手机在线观看| 亚洲爆乳无码精品aaa片蜜桃| 久久免费精品视频在这里| 欧美视频网站| 99亚洲伊人久久精品影院红桃| 欧美日韩中文字幕在线观看| 好吊妞视频一区二区三区| 国产av天堂无码一区二区三区| 欧美a一片xxxx片| 精品成a人在线观看| 在线视频成人| 色狠狠av一区二区三区| 精品一区二区91| 蜜桃视频在线观看www社区| 国产精品伦理一区| 久草视频手机在线观看| eeuss一区| 亚洲精品性视频| 91久久线看在观草草青青| 成人精品视频一区| 欧美一级专区免费大片| 日韩国产在线播放| 亚洲精品www.| 欧美日本黄色片| 日韩免费在线视频观看| 无码人妻丰满熟妇精品| 免费黄色网址在线| 日韩电影在线看| 亚洲bt天天射| 成人欧美视频在线观看播放| 国产又黄又粗又长| 中文字幕亚洲图片| 99热热99| 精品久久久久av影院| 久久影视三级福利片| 亚洲欧美影院| 国内精品亚洲| 少妇的滋味中文字幕bd| 欧美色图亚洲自拍| 免费成人午夜视频| 中文字幕你懂的| 先锋资源中文在线| 欧美国产日本高清在线| 欧美 日韩 国产 一区| 久国产精品视频| 99视频一区二区三区| 国产精品成人久久| 一区二区三区四区高清精品免费观看| 精品乱码一区二区三四区视频| 大型av综合网站| 精品人妻一区二区三区四区不卡| 欧美精品一区视频| 九九热中文字幕| 超碰高清在线| 日韩av免费网站| 亚洲18私人小影院| 久操视频在线| 中文字幕欧美人妻精品一区蜜臀| 久久久久久久久久久国产| 欧美亚洲免费电影| 中文字幕在线成人| 99视频精品全部免费在线| 精品免费视频123区| xxxx成人| 欧美在线观看日本一区| 日本天堂网在线| 国产欧美精品一区二区三区四区| 国产女无套免费视频| 国产污视频在线播放| 日韩视频一区在线观看| 中文精品视频一区二区在线观看| 精品少妇一区二区三区在线| 国产精品电影一区二区| 亚洲大片免费看| 国产成人午夜电影网| 欧美成人免费电影| 三级免费网站| 不卡电影一区二区三区| 在线免费看黄av| 久久久久国产美女免费网站| 黄色污污视频在线观看| 亚洲啪啪aⅴ一区二区三区9色| 2018av男人天堂| 欧美 激情 在线| 久久久人成影片一区二区三区| 黄色一级大片免费| 伊人久久国产精品| 国产伦精品一区二区三区四区视频| 黄色片在线观看免费| 亚洲综合视频在线观看| 亚洲精品成人无限看| 国产精品1区2区| 超碰精品在线观看| 91视频一区二区三区| 翁止熄痒禁伦短文合集免费视频| free欧美性| 国产精品一区二区三区四区色| 老牛精品亚洲成av人片| 在线视频中文字幕久| 久久久久久久久久久久久国产| 资源网第一页久久久| 欧美人与动牲交xxxxbbbb| 中文在线8资源库| 九九久久婷婷| 亚洲精品九九| 亚洲老女人视频免费| 中文字幕第31页| 日韩av中文字幕在线播放| 日本电影二区| 国产va免费精品观看精品| 欧美中文字幕精在线不卡| 国产精品另类一区| 3d成人动漫在线| 国产亚洲精品美女久久久久久久久久| 91亚洲男人天堂| av在线视屏| 日本网站免费在线观看| www.成人在线观看| 国产又粗又猛又爽又黄91精品| 少妇搡bbbb搡bbb搡打电话| 国产伦精品一区二区三区精品| av黄色网址| 亚洲天堂2016| 成人精品视频一区二区三区尤物| 桃子视频成人app| 国产麻豆一区二区三区在线观看| 国产高清一区二区三区四区| 欧美日韩国产在线观看| 精品久久久影院| 美国黄色特级片| 国产porny蝌蚪视频| 亚洲熟妇无码久久精品| 永久免费不卡在线观看黄网站| 视频在线观看入口黄最新永久免费国产| 欧美成人免费视频a| 欧美午夜片在线免费观看| 欧美性xxxxxx| 男人透女人免费视频| 成年女人在线视频| 日本黄色动态图| 日韩三级电影视频| 青青国产在线观看| 国产欧美一区二区三区精品酒店| 日韩成人av影院| 亚洲 激情 在线| 亚洲欧美日韩在线播放| 久久午夜羞羞影院免费观看| 日本精品一区在线| 久久亚洲一区二区三区明星换脸| 国产精品久久久亚洲第一牛牛| 亚洲国产一区二区三区网站| 在线日本视频| 91片黄在线观看喷潮| 男人天堂资源网| 加勒比中文字幕精品| 日产精品久久久一区二区福利| 久久久av水蜜桃| 国产一精品一av一免费爽爽| √天堂资源在线| 久久婷婷激情| 日本免费高清不卡| 日韩欧美中文一区二区| 精品影院一区| 久久免费在线观看| 视频一区视频二区中文字幕| 性感小视频在线看免费| 日韩精品影音先锋| 免费看黄资源大全高清| 性刺激的欧美三级视频| 白白操在线视频| 芒果视频成人app| 精品国产高清a毛片无毒不卡| 国产98在线|日韩| 国产精品久久久久影院亚瑟| 国产日韩一区欧美| 日韩在线视频免费播放| 尤物视频在线观看国产| 国产真实有声精品录音| 亚洲第五色综合网| 99久久综合网| 国产成+人+综合+亚洲欧美| 久久夜夜操妹子| 国产综合色激情| 91久久精品国产| 亚洲丰满少妇videoshd| 国产无人区码熟妇毛片多| 丁香婷婷久久久综合精品国产| 色综合久久一区二区三区| 天天摸日日摸狠狠添| 欧美视频自拍偷拍| 精品一区在线看| 在线最新版中文在线| **国产精品| 中国特级黄色片| 中文字幕视频一区二区三区久| 999久久久精品一区二区| 日韩成人视屏| 国产裸舞福利在线视频合集| v天堂中文在线| 免费黄网站在线观看| 久久丝袜视频| 丰满少妇乱子伦精品看片| 免费h网站在线观看| 欧美性生活大片视频| 欧美孕妇孕交xxⅹ孕妇交| 成人看片免费| 亚洲成人av资源网| 又黄又爽在线观看| 日本中文字幕一区| 日韩福利电影在线| 亚洲精品人成电影网| 黄色一级二级三级| 夜夜嗨aⅴ免费视频| 极品久久久久久久| 亚洲国产精彩中文乱码av| 欧美日韩在线观看一区| 亚洲视频重口味| 成人动漫在线观看视频| 欧美专区日韩| 三级在线播放| 欧美熟乱15p| 精品日产乱码久久久久久仙踪林| 99久久99热这里只有精品| 成人黄色激情网站| 网爆门在线观看| 亚洲欧洲美洲一区二区三区| 亚洲五月综合| 六月婷婷七月丁香| 性欧美疯狂xxxxbbbb| 精品国产福利在线| 日韩一区二区三区在线看| 亚洲欧洲一区二区在线播放| 黑人巨大国产9丨视频| 久草免费在线视频观看| 亚洲第一视频网站| 97操碰视频| 色偷偷av亚洲男人的天堂| 日韩激情视频一区二区| 一区二区三区短视频| 亚洲图片小说在线| 国产麻豆剧果冻传媒视频杜鹃| av男人一区| 亚洲欧美在线另类| 头脑特工队2免费完整版在线观看| 刘玥91精选国产在线观看| 欧美日韩一区在线观看视频| 国产精品日日做人人爱| 色呦呦在线视频| 香蕉国产精品偷在线观看不卡| 日韩精品一区二区三区三区免费| 熟妇人妻一区二区三区四区| 婷婷成人综合| 成人美女视频在线观看18| 精品国产一区二区三区久久久蜜月| 国产精品一色哟哟哟| av免费在线不卡| 麻豆精品在线视频| 国产精品嫩草影视| 欧美成人剧情片在线观看| 69久久夜色精品国产69乱青草| 国产酒店精品激情| 精品国产网站地址| 国产毛片久久久久久| 亚洲精品一区三区三区在线观看| 国产精品久久久影院| 日韩欧美国产高清| 亚洲国产精品天堂| 欧美.日韩.国产.一区.二区| 国产欧美一区二区精品婷婷| 91精品国产自产91精品| 国 产 黄 色 大 片| 午夜三级在线观看| 国产成人精品久久二区二区| 一区在线视频观看| 日本中文字幕久久看| 日韩成人中文电影| 精品日韩美女的视频高清| 欧美日韩亚洲第一| 中文字幕av一区 二区| 日韩激情综合网| 另类激情视频| 国产精品一级伦理| 中文字幕av一区二区三区谷原希美| 亚洲91在线| www.99视频| 韩国av一区二区三区四区| 成人av在线网站| 四虎成人免费在线| 丰满岳乱妇一区二区| 在线天堂中文www官网| 91国内精品久久久久| 亚洲电影免费观看| 欧美日韩亚洲丝袜制服| 青青草手机视频在线观看| 国内精品一区视频| 肉色欧美久久久久久久免费看| 亚洲免费电影在线观看| 香蕉视频在线视频| 美日韩一二三区| 国产 欧美 自拍| 亚洲av无码一区二区乱子伦| 国产永久在线观看| 桃乃木香奈和黑人aⅴ在线播放| www香蕉视频| 日韩一卡二卡三卡四卡| 亚洲3区在线| 97久久精品人人澡人人爽| 在线日韩影院| 青娱在线视频| 亚洲天堂成人av| 女人一区二区三区| 91网站观看| 亚洲免费成人av在线| 欧美激情五月| 91精品久久久久久久久久久久久| 免费观看成人鲁鲁鲁鲁鲁视频| 欧美一卡二卡在线观看| 久久天天狠狠| 又嫩又硬又黄又爽的视频| 激情亚洲小说| 国产真实乱在线更新| 天堂在线观看免费视频| 日产中文字幕在线精品一区| 亚洲视频精品在线| 日本免费无人高清|