地平线说峰值性能“虚无缥缈”,为何还发布5TOPS的旭日3 AIoT芯片?

标签: 芯片 | 发表时间:2020-09-09 22:45 | 作者:
出处:https://www.leiphone.com

AIoT芯片的能力近来持续提升。目前,业界大部分的AIoT芯片都采用28nm制造工艺,AI性能在1-4TOPS之间。本月初,瓴盛科技发布了一款用11nm打造的AIoT芯片,功耗大幅降低,提供2TOPS的AI性能。

9月9日,地平线发布其第三代AIoT芯片旭日3M和旭日3E,不仅采用先进的16nm工艺,高端的旭日3M能够在2.5W的典型功耗下达到等效5TOPS的标准算力。

旭日3的工艺和AI性能都显著高于大部分AIoT芯片,但有意思的是,地平线在上月雷锋网的一场活动中首提出的AI芯片评测方法——MAPS (Mean Accuracy-guaranteed Processing Speed,在精度有保障范围内的平均处理速度),就是希望业界评价AI芯片时不要盯着峰值算力。

旭日3在MAPS体系下的表现又如何?

AI性能高达5TOPS的AIoT芯片

地平线创始人兼CEO余凯接受雷锋网等媒体采访时表示:“我们希望用MAPS去展现AI芯片客观、真实的AI算力,而不是虚无缥缈的峰值性能TOPS。”

地平线创始人兼CEO余凯(左)、地平线AIoT产品线总经理王丛(右)

MAPS的评测方法由地平线提出,是要关注AI性能本质的做AI任务的速度和精度,即‘多快’和‘多准’,将每颗芯片在‘快’和‘准’这两个关键维度上的取舍变化直观地展现出来,并在合理的精度范围内,评估芯片的平均处理速度。

那旭日3M的AI性能为何高达5TOPS?地平线AIoT产品线总经理王丛表示:“地平线对重要应用场景中的关键算法发展趋势进行预判,5TOPS就是考虑了未来应用场景的需求。“

AI性能超高的旭日3在MAPS评价体系下也表现抢眼。根据地平线给出的数据, 旭日3可以有效适配Google提出的EfficientNet系列网络,性能可以超越业内领先的11.4TOPS算力的芯片。

旭日3系列分为3M和3E,均采用台积电16nm工艺。面向中高端市场的旭日3M搭载四核Arm Cortex-A53 CPU,2个地平线BPU架构NPU,等效算力为5TOPS,DDR(双倍速率)为3200Mbps;定位低端市场的旭日3E内置双核Arm Cortex-A53 CPU,同样包含2个BPU架构NPU,等效算力为3TOPS,DDR为2666Mbps。

旭日3M能够提供5TOPS AI算力的关键在地平线自研的AI专用计算架构BPU(Brain Processing Unit)。

地平线联合创始人兼技术副总裁黄畅说:“旭日3的AI性能极其出色,特别是在最新的边缘侧深度网络下有非常好的优化效果,使得客户可以充分利用芯片算力。在SoC处理器的基础能力之上,旭日3系列匹配强大的CPU、编解码、ISP能力,并且提供两种规格,以满足不同的市场需要,在行业内具有很强的竞争力。”

具体而言,旭日3能够高效处理4-8路不同分辨率的多Camera输入与精确同步,同时还支持多种图像后处理,例如畸变矫正、拼接、放缩等,并支持[email protected]的图像处理。

ISP方面,通过先进的ISP处理算法,使得旭日3在处理宽动态、低照度的场景下,能够得到更高质量的图片。

安全性也是旭日3的亮点,其有高级别的硬件安全保护机制,能够确保非法软件无法在旭日3上运行,同时还支持模型自动加载和内存隔离机制。并且,旭日3芯片还提供完善灵活的授权管理服务,不仅支持远端在线授权和离线授权,还支持授权模板自定义、授权码发放、账户权限管理和授权审计等服务。

接口对于一款SoC也非常重要,据悉,旭日3提供包含USB3.0、MIPI-DSI、I2S、I2C等丰富的外设接口。

硬件只是基础,软件和开发平台和生态也是AI芯片成功的关键。

开放平台应对AIoT市场多样化需求挑战

  “很多客户仍采用学术界较为传统的网络模型在做训练,这些传统网络需要花费更大的算力资源才能跑出新型网络下同样精度的效果。”黄畅说,“地平线希望提供一种全新视角,帮助客户为不同的AI任务寻找到效率更高、配适度更好的AI芯片和网络模型。“

为此,地平线推出了“天工开物“AI开发平台,主要包含AI芯片工具链、AI应用开发中间件、模型仓库和客户自建闭环四大模块:

  • AI芯片工具链环节提供模型量化训练、量化转换、编译工具和预测库等,最多可为用户节省50%算法研发成本。

  • AI应用开发中间件包含流式搭建AI应用、自动化模型调度机制和可复用的AI策略模块等,最高可节省50%的工程研发成本。

  • 模型仓库提供业界流行的模型、自研模型与最佳实践模型,最多能够节省70%的算法研发费用和90%的训练成本。

这对于应用场景丰富,但单个应用需求量较少的AIoT市场具有重要价值。 地平线AIoT产品线总经理王丛说:“经过几年的业务探索与技术积累,认识到客户看重产品的交付和快速落地能力,更需要构筑差异化能力建立自己的‘护城河’,所以地平线将积淀多年并经过应用落地验证的技术组件‘白盒’开放出来,其中包括中间件,参考算法,应用参考设计,算法训练平台等,帮助客户进一步加速AI落地。选择地平线不仅是选择一颗芯片,而是选择 AI 时代的长期伙伴。”

据悉,伴随旭日3推出的参考方案可应用于智能会议、智能家居、交互机器人、车载后装、通行考勤等诸多应用场景。

余凯接受采访时也表示:“2018年左右,我们就明确自己的定位是底层赋能,提供核心和芯片和软件,不会和我们的客户竞争,以开发者和合作伙伴生态双轮驱动。”

双轮驱动是3年内千万级出货量的保证?

地平线想要打造的是一个多层次、多维度、多样性的开放生态体系。开发者生态方面,地平线希望依托开放易用的“天工开物”AI开发平台,一站式AI开发者社区和AI加速营开发者扶持计划,向开发者提供加速AIoT应用孵化的全链条支持,实现AI应用的更多探索创新。

地平线合作伙伴生态的建设就是要坚持底层技术能力研发与解决方案的打造,面向AIoT垂直场景,由线及面应用到各行各业。

“在打造合作伙伴生态生态的时候,对于那些不具备软件能力的方案上,我们一方面会提供软件服务,需要特殊的定制化服务业可以做。也就是说,我们坚持底层技术的研发,但客户需要的时候我们可以提供任何层面的服务。”余凯表示。

生态的建设是一个长期的过程,既需要AI芯片的持续迭代满足AI算法需求,保持较高的性价比,更需要易用的软件吸引越来越多的开发者,越来越广泛地应用到不同领域才能实现生态的繁荣强大。

据悉,前两代旭日AIoT芯片出货累计达到了百万级,2021年,地平线计划推出旭日5。地平线预计未来3年内可以实现千万级出货,这也就意味着地平线的芯片会应用到消费电子领域。

接下来,地平线会继续与利尔达、OPEN AI LAB(开放智能)等生态合作伙伴一起,将旭日芯片应用到更多领域,尽早实现千万级出货的同时推动AIoT的发展。雷锋网

相关 [地平线 性能 虚无] 推荐:

地平线说峰值性能“虚无缥缈”,为何还发布5TOPS的旭日3 AIoT芯片?

- - 雷锋网
AIoT芯片的能力近来持续提升. 目前,业界大部分的AIoT芯片都采用28nm制造工艺,AI性能在1-4TOPS之间. 本月初,瓴盛科技发布了一款用11nm打造的AIoT芯片,功耗大幅降低,提供2TOPS的AI性能. 9月9日,地平线发布其第三代AIoT芯片旭日3M和旭日3E,不仅采用先进的16nm工艺,高端的旭日3M能够在2.5W的典型功耗下达到等效5TOPS的标准算力.

为什么地平线上的月亮大一些?

- Droking - 科学松鼠会
路口一转弯,忽然看到一轮巨大的红月亮漂浮在地平线上,像是日本漫画的唯美场景. Sheldon小时候就容易望着月亮发呆:为什么地平线上的月亮看起来比高高挂在空中的月亮大一些呢. 记得曾经从一本科普书中读到,利用现代科学仪器测量月亮影像在视场中的张角,得到的结果是30角分左右. 这在眼底也就占据了0.15 mm宽的地方[1].

地平线上的月亮为什么大一些?

- ys - 果壳网 guokr.com - 果壳网
说到月亮,大家想必有这样的体验:地平线上的月亮看起来比高高挂在空中的月亮大一些,Sheldon小时候经常望着月亮发呆,思考这是为什么. 【一轮巨大的红月亮漂浮在地平线上,像是日本漫画的唯美场景. 记得曾经从一本科普书中读到,现代科学仪器测量出月亮影像在视场中的张角是30角分左右,这在眼底也就占据了0.15 mm宽的地方[1].

为什么地平线上的月亮大一些?

- biAji - 牛博国际
路口一转弯,忽然看到一轮巨大的红月亮漂浮在地平线上,像是日本漫画的唯美场景. Sheldon小时候就容易望着月亮发呆:为什么地平线上的月亮看起来比高高挂在空中的月亮大一些呢. 记得曾经从一本科普书中读到,利用现代科学仪器测量月亮影像在视场中的张角,得到的结果是30角分左右. 这在眼底也就占据了0.15 mm宽的地方[1].

估值30亿美金的地平线,要狂奔去哪里?

- - 雷锋网
成长迅猛、高估值、产品更新快、软硬件结合,地平线留给市场的印象一直是纯粹的AI芯片公司. 但眼下,在追逐算力的道路上,它的前进速度又再一次超出了外界的想象. 2019年2月27日,地平线宣布获得6亿美元的B轮融资,由SK中国、数家中国领先的整车厂和旗下基金领投,估值30亿美元,成为全球最具价值的AI芯片公司.

MySQL 性能

- - 谁主沉浮
这里罗列了一些基本的 MySQL 性能提示,但不是放之四海而皆准,需要根据实际的应用情况而决定. 使用标准化设计(数据库三范式),记住表的联合查询(join)性能不会差. 选择合适的字符集,虽然UTF16无所不能,但需要两倍的存储;UTF8适合各种字符,但比latin1慢,尽可能选用latin1(此条不适合中文).

性能监控

- - 互联网 - ITeye博客
一旦你的服务器是在控制台模式下运行,你就可以开始我们接下来的内容. iostat  iostat 命令用来显示存储子系统的详细信息,通常用它来监控磁盘 I/O 的情况. 要特别注意 iostat 统计结果中的 %iowait 值,太大了表明你的系统存储子系统性能低下. meminfo 和 free  Meminfo 可让你获取内存的详细信息,你可以使用 cat 和 grep 命令来显示 meminfo 信息: 1 cat /proc/meminfo  另外你可以使用 free 命令来显示动态的内存使用信息,free 只是给你大概的内存信息,而 meminfo 提供的信息更加详细.

调查称伦敦骚乱的诱因是学生暑假空虚无聊

- Pen - Solidot
一项调查称,青少年在学校暑假期间感到“空虚无聊”推动他们当中的一些人参与前不久的英国大骚乱. 接受采访的青少年说,如果是在学校开学期间,暴力和抢劫活动可能不至于升级到毁灭性的程度. 活动人士说,本月初发生在伦敦并扩散到其它英国城市的打砸抢烧骚乱事件凸现了为青少年的闲暇时间提供更好机会的必要性. 几乎三分之一的伦敦受访者说,骚乱之所以发生是因为年轻人在暑期感到无聊.

高性能mysql 之 性能剖析

- - 数据库 - ITeye博客
1 定义性能优化 mysql服务器性能,此处定义为 响应时间. 在解释性能优化之前,先来消除一个误解,很多人认为,性能优化就是降低cpu的利用率或者减少对资源的使用. 资源时用来消耗并用来工作的,所以有时候消耗更多的资源能够加快查询速度,保持cpu忙绿,这是必要的. 很多时候发现 编译进了新版本的InnoDB之后,cpu利用率上升的很厉害,这并不代表性能出现了问题.

MySQL性能优化

- sun - IT程序员面试网
在笔试面试中,尤其是像百度,淘宝这些数据量非常大,而且用LAMP架构的公司,数据库优化方面就显得特别重要了. 此外,除了数据库索引之外,在LAMP结果如此流行的今天,数据库(尤其是MySQL)性能优化也是海量数据处理的一个热点. 下面就结合自己的经验,聊一聊MySQL数据库优化的几个方面. 首先,在数据库设计的时候,要能够充分的利用索引带来的性能提升,至于如何建立索引,建立什么样的索引,在哪些字段上建立索引,上面已经讲的很清楚了,这里不在赘述.