迎新春时尚穿搭教你学会 跳色点缀
189 2025-01-11
这是一份写给非技术岗的产品经理/运营的机器学习和深度学习的简单指南,帮助我们可以听到技术人员的话~
在“大热的AIGC究竟是什么”的文章中,我们聊到了人工智能以及生成式人工智能。这篇文章我们想继续聊下两个经常会和“人工智能”一起被提到的概念,那就是机器学习(Machine Learning)和深度学习(Deep Learning)。
机器学习(ML)是人工智能的一个研究领域,主要涉及开发和研究统计算法,这些算法可以从数据中学习,并泛化到未见过的数据,从而在没有明确指令的情况下执行任务。
请记一下关键字:学习。
机器学习到底在学什么呢?
我们在之前的文章中也有提到,机器学习的本质就是要让机器找一个函数。我们读书的时候都学过,y=f(x)=ax+b,其中a和b就是参数(Parameter),也就是我们要找出来的未知数。当我们找到这两个未知数之后,我们再输入x,自然而然就能得到y。是不是勾起了你读书时的回忆了?
机器学习其实就在学习怎么自动把这些参数找出来,但是通常它的函数非常复杂,所以要找的参数量也非常大,可能是上万个参数,可能是数十万个参数,甚至可能更多。
那机器如何学习呢?
举个例子:
还是用我经常用的例子,我要做一个应用,当输入一个图片,这个应用可以分辨出图片里的是柯南还是新一。那我就要找一个函数,这个函数输入是一张图片,输出要么是柯南,要么是新一。这个函数显然会非常复杂,复杂到有大量的参数。假设有上万个参数。
我们会告诉机器,输入第一张图,输出是柯南,输入第二张图,输出是新一……
有了这些输入输出,机器就可以把上万个参数找出来,学习把上万个参数找出来的过程,也叫做训练(Training)。而帮助你把这上万个参数找出来的输入输出,叫做训练资料。
但当机器找到这上万个参数后,也就意味着我们找到了这个函数。当我再输入一张新的图片,看看机器能不能回答对,这叫做测试(Testing)。当尝试输入如下图片,机器会给出“新一”的输出。正解!
这就是概念中所说的“泛化到未见过的数据,从而在没有明确指令的情况下执行任务”。因为可能机器以前也没有见过这张图片。
所以,如果说人工智能是一个目标,因为每个人对于机器做到什么程度才算是“智能”可能都会有自己的理解,那机器学习就是实现这个目标的手段。
深度学习是机器学习的一个分支,主要利用神经网络执行分类、回归和表征学习等任务。该领域的灵感来源于生物神经科学,其核心是将人工神经元堆叠成层,并 “训练 ”它们处理数据。形容词 “深度 ”指的是在网络中使用多层(从三层到数百或数千层不等)。
在今天机器学习的领域,有大量参数的函数往往会被表示成一个神经网络,而把这些参数解出来的技术,就叫做深度学习(Deep Learning)。也就是如果你用神经网络来表示,你就是在做深度学习。
所以,如果说机器学习是实现人工智能目标的手段,那深度学习是机器学习的一种,是一种更厉害的手段。
而现在绝大多数生成式人工智能都是用深度学习来达成的。
举个例子,大家最耳熟能详的ChatGPT。
如果我们把ChatGPT想象成一个函数,它的输入是一段文字,输出是ChatGPT给你的回复。如果要达到你问什么都可以得到不错的回复,那背后的参数非常之巨大。我们需要准备非常非常多的输入和输出,才能找出这个函数里巨大量的参数。这个有大量参数的函数表示成一个神经网络,在这个场景下会有一个专门的名字,叫Transformer,感兴趣的小伙伴可以自己去学习相关的内容~
本文由 @AI 实践干货 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务