深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?


深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

随着人脸识别、视频结构化等计算视觉相关技术在安防、自动驾驶、手机等领域走向商业化应用阶段,计算视觉技术行业市场迎来大规模的爆发。伴随人脸识别、物体识别等分类、分割算法不断提升精度。计算视觉的核心算法深度学习算法日渐成熟,通过对输出与对应输出数据的抽象计算,语音识别领域凭借深度学习取得重大突破,深度学习迎来包括学术探索与工业应用的热潮。在这一技术的支撑下,人脸识别技术大火。

Iphone X手机用一款Face Id高端人脸解锁软件,官方报道:“在一百万张脸中识别你的脸。”谷歌、百度、腾讯……各大企业都耗资数亿来推动人工智能方向的发展,而现实的人脸识别技术,真的有那么神奇么?随着互联网的进步,网络上各路大佬共享的各种资源库,人脸识别早已经不是特别稀奇的项目。现在只需用Python的数8行代码就可以完成人脸定位!小编用马蓉照片带大家做一个五官定位!当然程序中的pyth库使用到深度学习方法,来定位五官的。让机器学习上千张人脸,进行特征提取。然后用这个模型在新的照片中自己找出五官!

今天介绍一个快速定位人脸的深度学习算法MTCNN,全称是:Multi-task Cascaded Convolutional Networks多任务级联卷机网。这个快速定位的深度学习有3个很好的作用。

深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

本案就是利用MTCNN构建3个卷积网逐层处理,最终确定人脸个数,人脸的具体位置和五官位置!

深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

上图简析了程序的3个步骤。

stage1: 在构建图像金字塔的基础上,通过全卷机网检测人脸个数和大致区域,同时利用boundingbox regression (边框回归)和 NMS(非极大值抑制(Non-Maximum Suppression)来进行修正。(注意:这里的全卷积网络与R-CNN里面带反卷积的网络是不一样的,这里只是指只有卷积层,可以接受任意尺寸的输入,靠网络stride来自动完成滑窗)

stage2: 将通过stage1的所有窗口输入作进一步判断,同时也要做boundingbox regression 和 NMS。

stage3: 和stage2相似,只不过增加了更强的约束:5个人脸关键点。

程序对应的 create_mtcnn建立了这3个全卷积层。

深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

以上3图详解了3个全卷积层的尺寸构成。逐层细化,以此来加快速度是一个基本思路。程序结合opcv对图像进行实时采集和处理显示。最终结果

深度学习人脸识别仅9行python代码实现?同时高效处理100张相片?

下面小编在给大家分享python 百度云文字识别技术,下面是项目代码实现:

#导入模块

import urllib.request

import base64

from aip import AipOcr

#获取浙江云平台登陆验证码

re=urllib.request.Request("http://yun.zjer.cn/index.php?r=portal/Vcode/GetNewCode")

html=html.read().decode("utf-8")

#eval转化字符串到字典格式

html=eval(html)

imgcode=html["imageinfo"].replace('http:\\/\\/yun.zjer.cn\\/imgcode.php?d=','')

#unquote进行URL解码

#转化为base64图片编码

imgdata=base64.b64decode(imgcode)

""" 你的 APPID AK SK """

APP_ID = '你的ID'

API_KEY = '你的KEY'

SECRET_KEY = '你的SECRET_KEY'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

""" 如果有可选参数 """

options = {}

options["language_type"] = "CHN_ENG"

options["detect_direction"] = "true"

options["detect_language"] = "true"

options["probability"] = "true"

#调用百度云文字识别接口,返回字典数据

client.basicGeneral(imgdata, options)