返回目录:理财投资
原作:Supervise.ly
铜灵 编译自 Hackernoon
量子位 出品 | 公众号 QbitAI
人物检测确实是个老生常谈的话题了,自动驾驶中的道路行人检测、无人零售中的行为检测、时尚界的虚拟穿搭、安防界的人员监控、手机应用中的人脸检测……人物检测不易察觉,但已经渗透到生活中的方方面面。
作为计算机视觉领域的基础研究,很多初学者表示这件事耗时耗力很难搞定。在这篇文章中,机器学习平台supervise.ly提供了一种方法,据说十分钟搞定不是梦。
量子位将文章重点内容翻译整理如下,与大家分享:
人物检测在现在有多难?
五年之前,大家普遍在哈尔特征(Haar-like features)的基础上,基于级联分类器用OpenCV解决问题。这往往需要用大量的时间和精力构建模型,依照如今的标准来看,检测质量也不是很好。
要知道,深度学习时代来了,小小的人物检测任务也有了突破,将特征工程和简单的分类器结合已经过时,神经网络开始主导这个领域。
在这篇文章中,我们将用Supervise.ly平台处理人物检测任务,带你用5分钟做出初始方案。这个自称不用写代码、提供众多与训练模型、也无需在各种开发工具中跳来跳去的平台,对新手绝对友好。
基本方法
想要处理这个任务有两种方法:一是直接使用预训练模型,二是训练自己的人物检测模型。在Supervise.ly里这两种方法都可以,但我们重点来看预训练模型版。
我们将用基于Faster R-CNN的NASNet模型处理,此模型已经用COCO数据集预训练过了。
TensorFlow detection model zoo地址:
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md
Get主要方法后,打开Supervise.ly,我们开始进入正式构建步骤了。
Step 1:设置人物检测模型
设置检测模型很简单,只需将你的GPU连接到Supervise.ly,然后选择其中一个预训练模型即可。
进入Cluster页面,点击“Connect your first node”。
你将能看到下面这个窗口,将指令复制到你的电脑里,Python Agent软件将自动在你的电脑里完成安装。
点击“Neural networks”进入“Model Zoo”页面后,你能看到一系列为语义分割和物体检测创建的预训练模型。将鼠标放到“FasterRCNN NasNet”那里,选择增加一个新模型,你将看到这个预训练模型出现在了“我的模型”列表中。
Step 2:检测人物,判断质量
在你将模型部署为API之前,想弄清楚它是否符合要求可以先将神经网络预测可视化:将图片拖拽到的相关区域,运行推理过程。
在这个案例中,我们将项目命名为“text_images”,随后点击开始“start import”,用创建的图片检查项目。
随后,我们用这张图片测试人物检测模型的效果如何。在我的模型页面点击“Test”按钮,选择上面已经命名的“testimages”项目,将要存储检测结果的项目命名为“inf_test_images”。
现在,在“inference_full_image”列表中选择推理模式,将“save_classes”: “__all”替换成“save_classes”: [“person”]。
然后进入推理过程,模型看起来还算符合要求,我们进入下一步。
Step 3:将模型部署到应用
部署主要遵循通过调用API在自定义环境中使用模型的基本准则,部署前,需要先前往我的模型页面中创建新任务,将API请求发送到人物检测模型中。
随后,我们需要混获取token和URL信息。在“Cluster->Tasks”页面点击Deploy API info,就可以通过调用API满足检测模型所需的信息了。
运行以下命令:
可视化之后,我们发现输入的图片,已经得到了一张人物检测结果:
模型不仅识别出“深度学习三巨头”和吴恩达老师,连远处不仔细看绝对发现不了的人像也被检测到了。
最后,附原文链接,想要了解更多的同学可自取:
https://hackernoon.com/can-you-solve-a-person-detection-task-in-10-minutes-74fba061194c?source=rss——3a8144eabfe3—-4
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态