sakila

**对sakila数据进行实验分析## sakila**

1.

通过Python对数据进行处理,matplotlib生成折线统计图 代码部分:

from matplotlib import pyplot 导入csv文件,对该文件的数据进行分析

ID = [76,…,15725]

time= [15,…,48]

pyplot.plot(year, people)

pyplot.xlabel(‘ID’)

pyplot.ylabel(‘time’)

pyplot.title(‘折线图’)

pyplot.yticks([0, 20, 30, 40, 50])

pyplot.fill_between(year, people, 10, color = ‘red’) pyplot.show()

from matplotlib import pyplot

ID = [76,…,15725] TotalAmount= [15,…,48]

pyplot.plot(iD, TotalAmount)

pyplot.xlabel(‘ID’)

pyplot.ylabel(‘TotalAmount’)

pyplot.title(‘折线图’)

pyplot.yticks([0, 50,100,150,200,250])

pyplot.fill_between(year, people, 10, color = ‘red’) pyplot.show()

2.

通过分析time-ID图,可初步判定购买次数高分值落在100-200区间和500-550区间,在100-200区间中,最大购买次数 达到45以上,最低购买次数25以上;在500-550区间内,最高购买次数在45以上,最低购买次数在22以上;100-200区间内最大峰值48左右,最小峰值15左右,波动较大,最稳定顾客应该在ID为150的客户左右。500-550区间中最大峰值48,最小峰值18,波动较大,相比于100-200的区间,该区间的波动较稳定,购买次数最多的顾客应在ID编号为520左右。两个区间目测购买次数最多的人中,500-550区间的顾客更趋紧于最有潜力的购买顾客。 对最后结果选择出最有潜力的购买客户,相对于购买频率而言,购买总额的决定性高于购买频率,如果最终要筛选出最有潜力的购买客户,应选择从编号在520左右的客户进行更精细的筛选。以上实验内容仅仅对payment.csv进行了分析,还存在很多方面的偏差和漏洞,只是粗略的对大量数据进行了分析。

关于我

你想知道什么呢?

我的名字:FishYi,可以叫我小鱼,或者大鱼。

我的年龄:你都来了,我当然不能保密咯,hhhhh 我18,对,记住 呀,我永远18!

我的身份:穷学生一枚。现在于重庆某大学读大二。

我的爱好:我最喜欢的应该是散步吧!平常没事喜欢在校园闲逛,奈何教育部大大非要给大学生加负,所以作业贼多,今天要交报告,明天要交试卷,后天要交源代码……基于这些,我大部分空闲时间都在完成老师布置的作业的路上,hahahah.还有一个爱好就是欣赏品味唐诗宋词元曲了吧,徜徉在这些中国传统文化中,会让我忘记很多现实中的烦恼。

我的家乡:湖北襄阳。

现居地(也就是我美丽的学校了):

走在这一条小路的时候,感觉自己是仙女,哈哈哈
在这条通往图书馆的大道的一侧,是生机勃勃的油菜花
蔚蓝的天空

我的照片(我的沙雕自拍):

近日在寝室的闲来自拍
捂脸(><)


emmmm,记录一下 ,这是我建站第……第四天。好了,唠叨完了,我该去做作业了。

无题

    今天的天气,无风无雨,也没有阳光?emmm,我乱说的,作为一个在寝室宅了一天的人,就中午出去了一趟,还是去食堂,所以,寝室在六楼的我,怎么会清楚楼下人间的天气呢?!

    今天本应该很美好的,我几天前就去和几个好友相约周日出去玩的。但是,她们,都很忙。A呢,回家看外婆了;B呢,要练车;C呢,要考专四了,希望能考个好成绩,即便是在我的软磨硬泡下,依然选择去图书馆好好准备考试。所以,我只有在寝室写代码的命了,顺便完成了三月26号就要截止的一份报告。