计算机技术专硕,计算机技术专硕属于什么大类

训练机器学习模型通常意味着处理标记数据。例如,在计算机视觉任务中,一辆汽车上一个小时的行车记录仪视频,由人类精心划分标注,以指定道路、路标、车辆、行人等等。

但对人类来说,即使是标记这么少量的数据,也可能需要数百个小时,如此繁重且重要的环节,往往会阻碍接下来的训练过程。现在,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员正在介绍一种新的、最先进的算法,用于无监督完成计算机视觉任务,这种任务不需要任何人类标记。

该模型被称为STEGO,是“基于能量的图优化的自我监督变压器(Self-supervisedTransformer with Energy-based Graph Optimization)”的缩写。STEGO是一种语义分割算法,即标记图像中像素的过程。

另外从传统经验来说,对于像人或车辆这样的离散对象,语义分割是最容易的;而对于像云、灌木或癌症这样的环境中更不固定、混合的元素,语义分割就更加困难了。

“如果你在看肿瘤扫描、行星表面或高分辨率的生物图像,如果没有专业知识,很难知道要寻找什么对象。在新兴领域,有时甚至连人类专家都不知道正确的对象应该是什么。”

麻省理工学院CSAIL研究附属机构、微软软件工程师、描述STEGO论文的主要作者马克·汉密尔顿在接受麻省理工学院的雷切尔·戈登采访时解释道。“在这种情况下,你想设计一种在科学边界操作的方法,你不能依靠人类在机器之前解决问题。”

STEGO建立在DINO算法的基础上,该算法本身训练了1400万张图像。研究人员在各种测试案例中测试了STEGO,包括令人难以置信的多样化的COCO-Stuff图像数据集。研究人员报告称,在COCO-Stuff基准测试中,STEGO的性能是以往的无监督计算机视觉模型的两倍,在无人驾驶汽车数据集和空间图像数据集等任务中也表现出类似效果。

汉密尔顿说:“在制作一个理解潜在复杂数据集的通用工具时,我们希望这种算法能够自动从图像中发现物体的科学过程。在很多不同的领域,人类标记将是非常昂贵的,或者人类甚至不知道特定的结构,比如在某些生物和天体物理学领域。我们希望未来的工作能够使应用到非常广泛的数据集。由于你不需要任何人类标签,现在可以开始更广泛地应用于机器学习(ML)工具。”

计算机技术专硕(计算机技术专硕属于什么大类)

类似文章