一、为什么人工智能工程师被戏称为“调参侠”
1、确实,现在做人工智能方向的工程师,有不少被称为“调参侠”,但也并不全是。
2、以我自己为例,我做cv方向(计算机视觉)的,调参在我日常工作中占的比例并不大。
3、在CV这块,除了超参数外,影响模型效果的主要还是要网络结构、数据和损失函数,这三方面确定下来后,调参基本花不了多少时间。
4、在人工智能里面,参数大致可分为2大类:
5、目前AI人才竞争越来越激烈,“调参侠”的时代已慢慢过去,这些事情其实根本不需要AI工程师来做,未来的研发工程师就可以承担这些了!几年前如果熟练使用TensorFlow,同时掌握基本的AI算法就可以很容易找到一份高薪的工作,但现在不一样了,AI岗位的要求越来越高,对知识的深度也提出了更高的要求。
6、要想跟上时代,得武装自己,才能不被淘汰。
7、对于真正的人工智能工程师而言,他们往往是从数据和特征下手的,同时还需要丰富的行业经验。一定要记住一句行业内的谚语,数据和特征才决定算法的上限,而选择的算法和参数只是决定了已逼近这个上限的速度。
8、算法工程师技术上讲,基本上只和数据和模型打交道。模型就是一个黑色魔法盒,而这个黑盒子就是通过数据和调参而来。
9、模型中有两类参数,一类我们叫权重,可学习的参数;一类叫超参,需要不停地实验,来确定下来。所谓调参就是调教的后者。当然这些实验,需要专业的设计技巧,不在本文范围之内,感兴趣的可以找吴恩达老师的书看看。
10、很多人说算法工程师是调参侠,没技术含量。同样都是xgb,为什么有人能拿冠军有人只能很弱?或许你会说特征工程做的好。但换到图像和文本领域,模型的基本就是搭积木,这种搭积木也算是超参,模型的层数,模型的维度。
11、一项超分辨率比赛,韩国某支队伍获冠军,把大家都认为理所当然的批标准化去掉,意外获得了冠军。
12、实践很重要,调参不可耻。调的好,可以拿冠军。甚至可以将调参经验写成一篇论文。谷歌当时就有一篇论文,暴力的将各种函数尝试了一遍,发表一篇论文。
13、有时候是先走实践,再猜测或推测出来的理论。对不对?别管黑猫白猫,能抓耗子就是好猫。目标为导向。
14、并不是所有的调音师能超出美妙的音乐。虽然就那么几个音符。调参技巧弄得好,可以发论文,可以提升业务指标,带来利润。
15、不幸的是,大多数人一种都做不到。
16、厉害的调参侠,也不是那么容易当的。关键是思考,善于思考反思的人,无论是从理论还是实践,都会比机械重复的拿来主义进步快,更容易成为大侠。
17、调参侠其实和写程序所说的码农差不多的意味,是对从事这个行业人员的调侃。比如写程序的,刚开始都会接触增删改查的业务,做多了都会说curd一样。从事人工智能还有许多的其他名称,比如调包侠,指标奴。
18、人工智能的技术和知识还是很广泛的,并不只是调参。还有数据和特征工程,数学算法知识等。
19、第一次看到这个称呼,不过人工智能领域确实是有点这种问题。
20、我们举一个简单的例子,就拿现在比较火热的人工智能方法:深度神经网络来说吧。
21、顾名思义,神经网络就是当年科学家们用模拟人类神经元互相协调工作的办法来实现人工智能的一种理论算法。
22、在此再解释一句,所谓的神经元,就是人类的思维活动的承载零部件,大家在脑中的一些思维活动都需要有神经元的参与。
23、说白了就是几层神经网络叠加在一起。更为具体的原理,我在此就不赘述了,这个深度神经网络较为简单的说法,我们可以举一个比较形象的例子来说明:
24、我们现在采用深度神经网络的办法,来对这张图片进行识别。
25、那么一个人他具有哪些比较醒目的特征呢?
26、最为常见的,那就是有一个脑袋,有躯干还有四肢。但是这里就要存在一个问题,像平时生活中常见的小猫,小狗也是有一个脑袋,有一个躯干,也有四肢。所以说我们深度神经网络的第1层问题就是需要把这个人的这个轮廓和猫狗之类的轮廓和人类相似的来区分开来。在此不得不又要引出一个概念轮廓相似,这是一个说简单一点就是拓扑学上的含义。在此就不加深入讲述了,感兴趣的话可以自行搜索拓扑学的相关内容。在使用这个深度神经网络第1层判别人和猫狗之间的区别的时候,它就会存在一个神经网络的参数问题,我们需要将这个参数调整到一个适当的程度,才能将人和动物区分开来。
27、当然有了第1层区分之后,我们可能还有第2层以及更多层区分,比方说这个人是不是穿了衣服,这个人的肤色这个人的毛发,比方说头发是长在头上,而不是浑身上下都有。在这个时候,这一层的神经网络又会涉及到一个参数调整的问题,将参数调整到合适的值才能让机器正确的识别是否穿衣服,毛发是否都长在头上等等等等。
28、总之呢,我们从这个深度神经网络的识别的这个流程可以看到现在这些人工智能,实际上就是一个对现有模型中的一些参数进行调整的过程,所以说楼主问题中的这个调参侠确实是名副其实。
29、本来就是,有几个能提出来新模型,新思路的,太难了,都是炼丹师,也很难解释为什么
30、做人工智能的人,基本都和数据模型打交道,数据模型除了数据外,还有一个就是模型参数,参数是可调节的,我们通常说的超参数就是要进行调节,去适应数据,当然调参也需要数学功底,对算法的理解,所以,简单的说人家是调参也不太礼貌,人家能做的,你未必能做到。
31、能做出有效模型的少之又少,剩下的工程师确实就是剩下调教参数,找数据训练![大笑]
32、只会用别人的模型的人呗,其实这也是外界以及从事人工智能比较肤浅的人的一种误解和偏见。人工智能当然不能只用别人的模型。
33、因为算法封装之后,最高大上的就只剩下调参了,什么数据清洗,特征选取与特征工程不算什么技术活了,能干的人很多。就调参需要了解算法。