数据分析师与算法工程师薪资对比

天天见闻 天天见闻 2023-05-16 大数据 阅读: 109
摘要: Timeout=4)#参考分析网页数据导入格式res.encoding=res.apparent_encodingtext=json.loads(res.text):从网络招聘信息中,分别从北京、上海、广州、深圳、杭州等5个城市筛选数据分析师、算法工程师,采集样本。首先,我们来看看数据分析师和算法工程师的薪酬水平密度分布图。图中的红色部分是算法工程师的工资分布密度。

疫情即将散去,又到了求职季。学习的各位该如何选择自己的职业方向,算法工程师还是数据分析师?跟随本文一起看看吧!

数据获取与处理

本次样本数据采集于拉勾网,因为本文的重点是招聘数据分析,而在之前的文章中我们讲解过很多次如何使用爬取网页数据,这里就不再赘述,来看下爬取网站部分代码:

url_html = 'https://www.lagou.com/jobs/list_' + job_position + '?labelWords=&fromSearch=true&suginput=' 
params = {
'city': job_address,
'first': 'true' if i == 1 else 'false',
'pn': i,
'kd': job_position}
# 创建一个session对象
s = requests.Session
# 发送请求,获得cookies
s.get(url_html, headers=headers, data=params, timeout=4)
cookie = s.cookies
res = s.post(url_request, data=params, headers=headers, cookies=cookie, timeout=4) # 注意分析网页数据获取格式
res.encoding = res.apparent_encoding
text = json.loads(res.text)

本文在拉勾网招聘信息中选择北京、上海、广州、深圳、杭州这五个城市下分别以数据分析师、算法工程师为筛选条件来采集样本,采集到的原始数据如下:

当然我们在进行数据分析时不需要图中这么多变量,因此对数据进行清洗后最终样本数量为1979条,并选择以下几个变量进行分析:

薪资水平

我们首先来看下数据分析师与算法工程师的薪资水平密度分布图,绘制出这两个岗位的薪资分布密度图并标记出薪资的均值(图中虚线)

图中红色部分为算法工程师的薪资分布密度,蓝色部分为数据分析师的薪资分布密度,可以看出不论是数据分析师还是算法工程师,其薪资水平都是比较高的,但是算法工程师的薪资会更高一点,从两条虚线的位置可以看出算法工程师的平均薪资以29619元超过数据分析师的18841元!值得注意的是这两个岗位薪资均呈现明显的多峰形态,说明存在一类薪资相当可观的精英职位。

企业所属行业分析

本节通过制作词云图来对发布招聘企业所属的领域/行业进行分析:

上图为我们根据发布招聘信息的企业所属领域/行业的文本信息绘制的词云图,从图中可以看出数据分析师与算法工程师的行业有较大的交叉,主要都属于移动互联网、金融相关企业,但数据分析师的数据服务、电商、消费生活企业更多,而算法工程师的人工智能相关企业占比较高,所以想从事人工智能相关岗位的同学就往算法方向准备吧。

学历对的薪资影响

在本节,我们使用箱线图来分析学历对薪资的影响:

每一个箱子的宽度代表该学历提供的工作数量,纵轴为薪资高低,从图中我们可以看出,不论是数据分析师还是算法工程师,大多数岗位面向的对象为本科生。并且可以明显看出算法工程师对学历的要求更高,数据分析师有33个岗位要求最低学历为硕士,而算法工程师要求硕士的岗位有389个,并且值得注意的是:接近1000个数据分析师岗位均无博士学历要求,而算法工程师要求博士的岗位占比高于大专。所以想要从事算法工程师相关岗位还是先努力提升学历吧。

技能需求分析

我们提取数据分析师与算法工程师岗位所要求的技能/语言相关信息(仅为标签中需求并未提取详细要求中技能需求),对其进行可视化

可以看到对于数据分析师来说,需求最高的是SQL,其次是BI软件与SPSS以及Hive和等大数据相关,虽然也有Java等,但是总体对于编程语言需求不高,值得注意的是只有一家公司需要应聘者会使用(用女朋友担保真的只有一家需求中含有)。再看右边的算法工程师,对于NLP的需求最高,其次C/C++、、JAVA、GO等各种编程语言都有,值得注意的是有些企业还需要求职者懂一些Linux运维相关的知识。

回归建模

上面的分析仅是从一些描述性分析的角度,在本节我们对影响薪资水平的各个因素进行回归建模来量化分析,由于原始变量太多存在多重共线性,因此我们选择主成分回归模型:先利用主成分分析对各个变量提取主成分,然后对变量进行中心化与薪资对数化,接着建立回归模型,最后将回归方程中的主成分转换为原始变量。

数据分析师影响因素的回归系数

算法工程师影响因素的回归系数

对比两个图可以发现,不论是数据分析师还是算法工程师都对工作经验有着较高的要求,其中算法工程师要有3-5年的工作经验才算能对薪资水平有一个“正向”的影响。其次数据分析师对SQL和Hive较高的要求而算法工程师要求的语言则是和C/C++,当然这只是个人因素对薪资水平的影响分析,公司层面的因素就留给感兴趣的读者去做。

聚类分析

在这一节我们为了更加细致地了解两个行业内部岗位的分布,我们对数据分析师与算法工程师的影响因子进行了聚类分析,对聚类结果进行总结得出这两个岗位的三个典型职位

数据分析师的三个典型职位:

算法工程师的三个典型职位:

费希尔判别分析

上面做了那么多又是主成分回归建模又是聚类就是为了本节进行判别分析,我们可以利用费希尔判别法(之前文章有讲过哦)根据求职者的条件针对上一节的三个典型职位进行判别,并代入我们的模型就能预估求职者的薪资,例如

某位求职者:

那么使用费希尔判别法就能判定该求职者属于数据分析师的普通岗位,并可以利用之前建立的模型预测薪资大约为5247元,但如果该求职者能学会Hive与那么薪资将涨到7144元。

结束语

从结果来看数据分析师与算法工程师都属于比较高薪的岗位,这也解释了为什么这两个岗位火热的原因,虽然两个岗位有一定交叉,但还是有一定区别,比如这两个岗位所需要的编程语言不大一样。并且算法工程师需要的学历更高一点,但数据分析师对工作经验的要求没有算法工程师的要求高。所以求职者可以根据自身情况去综合考虑。

作者本文使用了(爬虫()数据清洗()建模())(绘图)R(绘图()密度图、箱线图、建模)SPSS(建模:主成分分析),这也是之前文章提到的要学会综合使用各种编程语言。

以上就是本文作者对爬取到的招聘数据进行的挖掘与分析,当然由于作者的能力有限,并且在之前的建模中可能忽略了一些关键的变量导致得到的模型并不是十分准确,感兴趣的读者可以后台回复招聘获取本文使用的数据进行更多的分析~

声明:本文仅供技术交流,禁止商用。

其他相关
亚马逊算法重大变革,AI时代下亚马逊卖家的运营方向在哪?

亚马逊算法重大变革,AI时代下亚马逊卖家的运营方向在哪?

作者: 天天见闻 时间:2024-05-04 阅读: 1
亚马逊算法的变动更新,跟每位亚马逊卖家息息相关。因为这些变动可能会改变商品的展示方式、影响搜索排名并最终影响到销售结果。 近期,亚马逊推出新算法COSMO的消息在亚马逊卖家群引起了广泛关注。 新算法的实施预示着亚马逊流量分配机制将可能经历一次重大调整。卖家原有的产品排名优势是否还能存在,固有的搜索排名逻辑又会发生这样的变化?新算法是对原来A9算法的颠覆性改变还是只是A9算法的进阶,亚马逊卖家该如何思考未来的运营方向? 01、A9算法是否要成为历史?...
看透本质,你就是传说中的“神”

看透本质,你就是传说中的“神”

作者: 天天见闻 时间:2024-04-16 阅读: 1
“得道”是能够抓到事物本质,“开悟”则是能够瞬间看到真相。“道”是“本质”,“因果”就是“真相”。什么是一眼看穿本质的能力?这就是本质,真正看透“飞翔”的本质,才能真正飞起来。这就无限接近世界的“本质”,即:真相。拥有上帝视觉就是知道“我活着”,“我看着我在活着”,也便能看透这芸芸众生相。...
识图网站yandex 识图网站

识图网站yandex 识图网站

作者: 天天见闻 时间:2024-04-14 阅读: 1
百度识图不能用。求解进入百度首页,如下图所示:点击【更多】百新产品大全中找到【百度识图】点击进入。可以在网上找或者本地电脑上的图片上传上去。都可以搜索到的。搜索结果如下图所示:、都是差不多寸尽和内容的图片。注意事项如果您觉得该经验对您有用,请点击页面右上角上的【大拇指】或【分享】或【关注TA】给我一个支持。如果……...
三角定位法原理 三角定位

三角定位法原理 三角定位

作者: 天天见闻 时间:2024-04-10 阅读: 1
排列三定位投注法指的是什么现代的GPS定位,其原理是根据卫星定位,既卫星发射信号,到物体反馈,计算时间可得到距离。问题是,当已知一点及距离,你只能画一个圆。所以,2颗卫星的时候,对一个物体定位,就是两个以卫星为圆心的圆。你会发现,已知两个点及距离的情况下,两个圆的交汇处有两个。SO,3颗卫星才能确定物体的位置……...
亚马逊运营招聘涨3倍!深圳薪资大涨

亚马逊运营招聘涨3倍!深圳薪资大涨

作者: 天天见闻 时间:2024-04-09 阅读: 2
求职、招聘是当前行业热门话题。 统计数据显示,2024年亚马逊运营招聘量则较去年同期增长316%,深圳、广州等地需求翻倍增长。2月,深圳该岗位平均月薪环比大涨31%,达到12776元;广州今年岗位薪资也连续上涨,2月平均月薪为8130元,让求职运营颇感振奋。 上周,脉脉高聘发布《2024“大厂平替”公司推荐榜》,安克创新、传音、追觅科技、影石Insta360几家跨境公司上榜,目前,这些公司都在招聘多个跨境电商运营相关岗位,将成为运营求职首选。 亚马逊运营招聘量激增...
西麦科技申请基于人工智能算法的室内地图自动识别绘制方法及装置专利,提升地图绘制效率

西麦科技申请基于人工智能算法的室内地图自动识别绘制方法及装置专利,提升地图绘制效率

作者: 天天见闻 时间:2024-04-01 阅读: 1
金融界2024年3月30日消息,据国家知识产权局公告,广州西麦科技股份有限公司申请一项名为“基于人工智能算法的室内地图自动识别绘制方法及装置“,公开号CN117782061A,申请日期为2023年12月。 专利摘要显示,本发明提出了一种基于人工智能算法的室内地图自动识别绘制方法及装置,所述方法包括:基于室内空间布置基准定位设备,并确定关键位置坐标;获取关键位置坐标相对于各所述基准定位设备的固有信号参数;基于固有信号参数获取各关键位置坐标处的图像,以及图像中各关键标识元素的特征参数;基于各关键位置坐标、各关键位置坐标处的图像及对应图像中关键识别元素的特征参数,根据预设算法绘制室内地图。所述装置用于实现所述方法。本发明可以实现室内地图的自动识别和绘制,提升了地图绘制效率。...
我来说两句

年度爆文