<1902100003>-<自学数据营>-<Updated daily>
学员信息
· 学号:1902100003
· 学习内容:自学数据营-E05
· 学习天数:day 018
· 学习用时:5小时
<总结>
- 拿到作业5第四天,通过教练的帮忙,我终于把TabPy的安装问题解决了。这一天过的非常漫长。
自己做事来还是太过没耐心、拖延。毫无进展的情况下,未及时开口向别人求助,因此浪费了很多时间。还把自己搞得灰心丧气。
- 要对自己有耐心、有信心,否则,连资料都读不进去,总走神。
- 前期搭建完毕,后续操作并不容易。本想今天一口气解决作业,但发现自己无法完成,只能再给自己点时间。
- 在教练的帮助下,成功连接TabPy后,又出现了各种小的错误。意外的是,已经晚上十一点多了,教练还在耐心回答我们的问题。非常感动。我也趁机揪住教练问了几个问题,心中的焦虑缓解不少,睡了个安慰的觉。
- How Do You Start Machine Learning in Python? The best way to learn machine learning is by designing and completing small projects.
因为前期未参加<自学训练营>,做起作业来确实比其他同学要吃力很多,总是卡壳。很多资料看起来并不轻松。前4次作业的“轻松感”,已然消失。 If you shed tears when you miss the sun, you also miss the stars.
<遇到的难点与问题(是否解决)> 昨天的作业问题已解决。新问题又陆续开始。
学习笔记
· 学号:1902100003
· 学习内容:自学数据营-E05
· 学习天数:day 017
· 学习用时:5小时
一直卡在Tableau安装上了。
- 经过教练的提醒,才得以找到解决我Tableau版本过期的问题。
- 感觉自己走进了死胡同,下次会早点向教练求助。
- 这几天的毫无进展,让我发现自己的一些问题的纵容及毫无办法。我会选择中间会停下来,看点别的 书籍或其他相关书籍,好在时间没有浪费。
- 发现自己“只字不差”的阅读能力真不是差,而是根本没有。懊恼自己的情绪伴我左右。
- 晓镜同学是激励我的榜样。
<遇到的难点与问题(是否解决)> 作业问题仍未解决
学习笔记
· 学号:1902100003
· 学习内容:自学数据营-Tableau与Python协作
· 学习天数:day 016
· 学习用时:6小时
拿到作业5第三天,仍没任何进展。对我打击很大。
一直卡在Tableau安装上了。
- Tableau14天的试用期已过,下载了Public版本作为替换。(最后下载了一个Date Stopper,成功下载了一个8.2版本的Tableau Desktop)
- 按照安装文档一步步操作,但是并没有那么顺利。第二个[Setup and Startup TabPy Server] 链接始终打不开,跳开它安装也并未成功。
- 下载了TabPy文档到本地。按照操作文档步骤,却始终无法链接。
-




<遇到的难点与问题(是否解决)> 仍未解决,打算第二天跟教练求助。
学习笔记
· 学号:1902100003
· 学习内容:自学数据营-E05
· 学习天数:day 015
· 学习用时:1小时
收到作业的第二天,仍旧卡在第一步,要疯了,无法向前迈出一步。 偷看了晓镜同学成功经历的笔记,但是换到我自己,仍旧无法成功。 按照她的步骤,反复捣鼓1个多小时,仍旧无功而返。 打算第二天向教练求助。
<遇到的难点与问题(是否解决)> 未解决。
学习笔记
<收获总结>
学习心得
· 学号:1902100003
· 学习内容:自学数据营-直播课
· 学习天数:day 014
· 学习用时:2小时
1、E04作业已交,拿到E05作业,明显感觉到难度系数增加。是Tableau与Python的协作,首先需安装配置TabPy服务器,尝试超过15分钟未成功。白天没大块时间,准备下班后晚些时再试。
2、前天通知今天晚上20:00有直播,非常兴奋。下面说几点自己印象深刻的点。
此次直播解决了我上课前的几点疑惑。学习Python、Tableau等工具后,怎么用好?学好跟用好之间那道那不见的鸿沟到底是什么?老师给的回答大意是这样的,当日后你有能力从事数据分析工作,千万不要沉迷于工具和方法,而要把重点放在如何掌握解决问题的能力,如何把握工具传达信息的逻辑能力上。
推荐了几本书。我去豆瓣上搜了一下大致的内容,对目前的我理解可视化图表很有用。
笑来老师不建议跟别人索要书单,或者把别人的书单拿来就用。
所以,根据自己的情况,选择性阅读。
这些书有基础书籍,比如第一本,也有难度相对拔高一些的,比如第二本

数据分析师与商业分析师
数据分析师与商业分析师是有区别的,前者对编程和技术的要求比较高,更倾向于相关人员向你提出一个需求,你来想办法找出其中的关联。比如业务问你为什么这周的销量不如上周,为什么某个单品的销量会突然飙升等等,你要从数据中找到原因,为他人提供帮助。而后者呢,更侧重于通过数据分析,为他人出谋划策或提供咨询意见等,对编程和技术的要求相对低一些。
知道这两者的区别,有助于选择学习的内容及方向。
商业分析师需要去了解组织的框架与逻辑,背后运行的底层原理,通用的框架是什么,某些场景的具体分析方法,看数据的套路。要求有较高的综合能力。
想成为一名好的数据分析师,就要学会“化繁为简“。下左右两图形成强烈对比,左图图明显花哨,信息冗余,右图(经过清晰地思考后),处理出清晰的可视化图表,看起来精神多了。

多练习,多思考
如果对练习的数据源一筹莫展,可以试试Kaggle。
每次做图表的时候都把自己当成一名设计师
<遇到的难点与问题(是否解决)>
总结自己
仍旧心浮气躁,虽然作业可以很快就完成,但很难静下心来真正看下去大量的资料,尤其是英文的。但是我很愿意动手去做各种表格,过程中会发现很多隐藏的“小机关”。所以我的学习方法可能就是通览资料后,开始动手,如果卡壳了,再回去翻资料。心浮气躁带给我很多不必要的麻烦,走弯路,高出错率,对知识点理解不足。
同样的半杯水,有的人看到的是“只有半杯水了”,另一些人看到,“还有半杯水呢”。这有很大不同。最近在看其他学员的笔记,最触动我的几点,是大家都很有章法。比如晓镜。
而我回放自己整个学习的过程,完全就像一个在战场上丢盔弃甲四处逃窜,勉强度日的士兵。
何以至此?
首先,我未拿出一个好的学习心态。未安顿好自己的心浮气躁。
其次,我的非良好的学习方法及习惯,导致自己的compound跟别人的根本不是一个size。
导致自己脑子里清晰的必要基础概念越来越不够用。
所以,我最近为自己做了很多心理建设的工作,把《七年就是一辈子》、《把时间当作朋友》、《人人都能用英语》的书,对照自己的手写笔记,重新梳理了一遍。明显觉得自己没那么浮躁了。但学习的方式方法,仍是我的一块心病。也找到了我这么多年,学什么都无法成为一门手艺的真正原因。
加油!
学员信息
· 学号:1902100003
· 学习内容:自学数据营-E05
· 学习天数:day 019
· 学习用时:2小时
<总结>
目前的学习进度,学习质量与预期相差甚远。
最近越来越觉得,学习能力最后拼的也是一个人底层的认知能力,或者说心智的能力,脑子里清晰准确的概念越多,越知道如何去学习,如何规划,以及为什么而学?(这里那Python举例)而不是随波逐流,大家都觉得Python有用,就一时头脑发热,跟风去学习,报了班发现一切都跟自己想的不一样呢,学习Python不应该是很轻松很有趣的吗?为什么别人学起来那么容易?为什么资料看起来很简单,我就是学不会,我该不该放弃,我是不是不适合,我是不是真的不行……被自己的质疑围攻致死。而是要在一开始就想清楚,我为什么而学?下定决心一定要学好,给自己信心一定会学好。过程中遇到困难是肯定的,想要退缩也是正常的,咬咬牙,坚持一下,过去了就过去了,过不去也就再也过不去了。(之前自己有过无数次学习英语,半途而废的经历。)
回忆这半月以来,自己学习效率高,完成度高,甚至加入了自己的思考,感悟和延申的体验,无一例外是注意力、目标感、身心状态高度统一的时候。我有过这种非常投入的心流状态,那么问题也来了,如何保持这种学习状态??如何在每天紧凑的生活节奏中,维护自己的这种“多巴胺”。 我自己的体验:来自**“每天真切感受到自己在进步”**,自己在生长。 如何使自己感受到自己的这种感受?持续的记录、总结,复盘、验收自己的所学。
(最后一次说这些话,前面好像说过了) -基础薄弱,无论是英语还是计算机方面。 -缺乏耐心,刚开始是看英文官方文档越看越焦躁,到后来非常惬意享受,一键转中文后,再次失去耐心,这是导致学习进展缓慢、质量差的根本原因。 -学习习惯不好。每次拿到作业还会下意识地,后台运行之前的陋习,“为了完成作业而完成作业”,不阅读基础知识,直接拿着问题去找答案。经常找着找着,就会迷路。
我为自己找到的改进办法 -边完成数据营的作业,边进行自学营的学习内容。(补课) -不要给自己心理暗示,催促自己。(有稳定的学习状态) -改变原有的学习方法,尝试其他的学习方式。 -坚持阅读英文官方文件,即使很慢,也不要对自己失去耐心。 -增加思考的深度与广度。 -总担心自己的问题很傻,困住也不问。 -对新鲜事物非常好奇,利用好这个好奇。
<遇到的难点与问题(是否解决)> 看不进去官方文档。看了相关的书《数据可视化指南》,作者的几个问题,又燃起了我学习的热情。顺着之前直播课老师推荐的书,在多抓鱼跟蜗牛上又选了几本相关的书籍,津津有味的读起来。
比如说,国民有权利了解政府把税收收入都花在了哪里,而在此之前美国政府给人的感觉就像一个黑箱。Data.gov上的很多数据其实在许多网站中都能找到…… 几乎可以这样说,只要你想对自己的某个方面进行追踪,就会有这样一款应用来帮助你实现愿望。
可以把在数据营每天的学习情况,做成可量化的可视化图表。除了时间,还可以结合自己的情况,为自己相关的可视化维度,每天学习的完成度、完成质量、作业完成情况、教练的反馈、相关资料阅读情况等等。
学员信息
· 学号:1902100003
· 学习内容:自学数据营-E06
· 学习天数:day 020
· 学习用时:1小时
<总结>
看不进去官方文档,打开作业,觉得每个问题都很有趣,带着问题去找答案,发现这种方法很浪费时间,且很不适合注意力非常难以集中的我。经常就迷失在什么岔道里,出不来了。这时,一个脾气非常不好的“烦躁先生”就杀出来,怎么轰都不走。
<遇到的难点与问题(是否解决)> 看不进去官方文档。
学习的过程,也是一个不断地认识自己,刷新自己的过程。 这一天如果我学习数据营的时间很少,我可能会把全部时间集中到作业上。 相反,如果我了解自己,知道自己读官方文档会觉得枯燥,难以下咽,会首先给自己一道开胃菜,挑选一些相关书籍中感兴趣的章节去读,真的这样做了之后,我发现自己看英文的速度也会加快。 要改变自己内心对英文及学习学不好这件事的抵触情绪,首先就要让自己的内心卸下防御,就像培养孩子对学钢琴或阅读的兴趣一样,要首先让孩子觉得“这件事有趣”,“这件事与我有关”,她才会自主自发地学习。这也是教育的最高境界。
学员信息
· 学号:1902100003 · 学习内容:自学数据营-E06 · 学习天数:day 021 · 学习用时:3小时
<总结>
NumPy,数组(Arrays)
Numpy是一个功能强大的Python库,源于两个单词——Numerical 和 Python,主要用于对多维数组执行计算。主要应用于:
- 机器学习模型:进行各种数值计算;
- 图像处理和计算机图形学:库函数可以快速处理图像;
- 数学:数值积分、微分等,形成一种基于Python的MATLAB的快速替代。
安装就很简单啦~ pip install numpy
Numpy又大量的函数和运算符(打开第六次作业就知道了)
- 假设,创建一个长度为5的NumPy数组,但所有元素都为0。 #使用import numpy作为np导入Numpy,与 np.zeros 类似,有 np.ones、 np.random.random
import numpy as np
my_new_array = np.zeros((5))
print my_new_array
#输出结果 [0., 0., 0., 0., 0.]
NumPy 中的数组(非常好玩儿)
- 创建一个一维、二维数组
- 多维数组切片,切片(Slicing)
基本操作符 +、- 、/ 数组特殊运算符 索引
- 整数数组索引 #整数数组索引的一个有用技巧是从矩阵的每一行中选择或改变一个元素;
- 布尔数组索引 #布尔数组索引允许选择数组的任意元素。
数据类型
创建Numpy数组的方式
- 使用Numpy内部功能函数
- 从列表等其他Python的结构转换
- 特殊的库函数
#创建一维数组
import Numpy as np
array = np.arange(20)
array
#创建一个二维数组
array = np.arange(20).reshape(4,5)
array
#创建一个三维数组
array = np.arange(27).reshape(3,3,3)
array
结果
array([0, 1, 2, 3, 4,
5, 6, 7, 8, 9,
10, 11, 12, 13, 14,
15, 16, 17, 18, 19])
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
array([[[0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8]],
`[[ 9, 10, 11],`
`[12, 13, 14],`
`[15, 16, 17]],`
`[[18, 19, 20],`
`[21, 22, 23],`
`[24, 25, 26]]])`
- 从Python列表转换 广播(Broadcasting),允许numpy在执行算术运算时使用不同形状的数组。
<遇到的难点与问题(是否解决)> 作业中创建不同数组、切换。 记不住呀~~~ (第二遍的时候,好一点了。开始的时候,真的很蒙)
学员信息
· 学号:1902100003 · 学习内容:自学数据营-E06 · 学习天数:day 022 · 学习用时:1小时
<总结> 一天没什么时间,把前一天的内容,英文版的资料,边查字典又看了一次。
<遇到的难点与问题(是否解决)> 数组、库函数仍旧迷糊。持续熟悉中。。。
学员信息
· 学号:1902100003 · 学习内容:自学数据营-E06 · 学习天数:day 023 · 学习用时:6小时
<总结> 虽然看了资料,但是真正开始下手写的时候,还是需要对照资料才可以。 边写作业,边拓展,花了很多时间。
随机数组怎么建立?中位数怎么得到?
对角线下的值,我之前做作业的时候,一直看成“对角线的值”,导致不同的结果
zeros用错,始终得不到作业的答案。做完其他题之后,回过好几个头来,才发现。改正。
<遇到的难点与问题(是否解决)> 近两次作业做的时间比较长,原因除了心态不端正外,没整块的时间读资料。 (没整块时间学习,导致自己很焦虑,焦虑导致心态改变,心态不端正就影响学习效率。) 别让境遇翻身农奴把歌唱。
学员信息
· 学号:1902100003 · 学习内容:自学数据营-E06/07 · 学习天数:day 024 · 学习用时:2小时
<总结>
- 第6次作业漏洞百出。许多细节未注意及解决。
可能是作业6保存或复制的时候,有问题,导致教练收到的作业,跟我自己的不太一样。 我把教练标记出来的又写了一次。
- 第7次作业
掌握 NumPy 的随机模块
-
常见的随机数函数
np.random.rand(3, 2)array([[ 0.15069669, 0.05796857],[ 0.31201132, 0.38995779],[ 0.59755402, 0.97105107]])` -
numpy.random.``choice(a, size=None, replace=True, p=None) -
[随机数种⼦的用途] numpy.random.seed
numpy.random.``seed(seed=None) -
洗牌函数
arr = np.arange(10) np.random.shuffle(arr) arr [1 7 5 2 9 4 3 6 0 8]
Multi-dimensional arrays are only shuffled along the first axis:>>> arr = np.arange(9).reshape((3, 3)) >>> np.random.shuffle(arr) >>> arr array([[3, 4, 5], [6, 7, 8], [0, 1, 2]])
掌握 NumPy 的排序
numpy.searchsorted(*a*, *v*, *side='left'*, *sorter=None*)[[source\]]
掌握 NumPy 的基本运算
明天继续
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 025
· 学习用时:小于1小时
<总结>
- 第6次作业审题不清,导致许多细节未注意。
- 仍旧读的中文资料大于英文的资料,导致很多知识点一知半解。有点讨厌
对比运行 print后,是否需要加 **()**括号

学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 026
· 学习用时:小于1小时
<总结>
- 这两天处在疯狂做作业,找到正确答案上。至于这件事本身,是否有意义,从不考虑。
- 但其实我需要回过头,先把地基打牢。
- 工作日的时候一天时间真的很不好用,晚归后,只能看一会儿资料。
- 时间调整成每天早起后看英文资料。虽然真的需要很多时间,进度缓慢。
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 027
· 学习用时:小于1小时
<总结>
- 交了第七次作业。自认为比第六次作业做得好很多,应该不会错。除了一道跟时间有关的问题,我不 知道应该用什么来解决。
- 最后向教练求助
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 028
· 学习用时:小于1小时
<总结>
- 思考我不能提出好问题,不能准确无误地完成作业的原因。
- 调整目前的学习模式。
- 准备周末先把Numpy前面的英文资料读通之后,再进行下一次作业。
- 如果有时间(当然没时间也要挤出时间),想把之前学的Tableau复习,实操一下,感觉快要忘了。
- 工作中想用一下Tableau,发现自己根本就无法灵活使用。Tableau对我来说,仍不是朋友,而是一个 陌生人,虽然我们已经打过很多天交道。
- 今早花了一个小时的时间读原文,太吃力了。但也有收获,虽然很不起眼。
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 029
· 学习用时:小于1小时
<总结>
最近地铁上读了一本讲德国法律的书,是一部历史上有名的案子。
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 030
· 学习用时:小于1小时
<总结>
要看一下印象笔记的记录。再来更新
学员信息
· 学号:1902100003
· 学习内容:自学数据营-Numpy
· 学习天数:day 031
· 学习用时:小于1小时
<总结>
xue.cn上笑来老师更新了一本新书,有关Python。 这两天陆续看了一些。 目录大概是
- 变量,赋值和运算符优先级
- 条件控制
- 数据类型,类型转换和浮点运算
- 函数
- 库函数
- 数据结构
- 数值运算
- 绘图
- 错误处理和测试
- 算法
- 复杂度
- 面向对象的设计 可爱。对自己之前的学习是一个很好的补充跟延展。


