Xbox购买以及Kinect简介
周末一冲动,就跑去岗顶的百脑汇把xbox 360抱回来了。直接原因是那天水群里面cc发了一个最终幻想13的视频。其实说起来,我一直是一个伪游戏玩家。当年打了很多年的星际,但是到后来其实就玩的很少了。
NDSI什么的,被我买过来,我都是专挑各种智力逻辑游戏玩玩而已,然后就开始落灰了。游戏机本身其实也没太多注意的,我大致关注了一下破解的进展。现在不需要改机改光驱什么的了,只要软改就可以破解。现在一般都是捆版kinect套装,然后加个硬盘就可以了。但是破解之后不能玩Live,这让我很是郁闷。我研究了一下是否可以把固件刷回去,不过暂时基本不可能。需要注意的是,标配带的是AV线,直接插电视机。但是对于这等支持全高清1080p输出的机器,我家的彩显电视机真是暴殄天物了。然后就弄了条HDMI转DVI的线接到了我的显示器上面。但是郁闷的是,HDMI是带音频输出的,然而我的显示器并不带音频输出,因此需要再买一条VGA线专门用来输出音频。我今天享受着Crysis引擎的次世代画面的时候,完全没有声音!泪流满面啊。
其实本人买Xbox的主要目标是奔着kinect去的。因为自己专业的一些原因,很早就关注过kinect,我毕业论文的一些相关内容的作者,就是Kinect中,humam pose estimation方面的主要负责人。
kinect有三个摄像头,一个RGB摄像头+一个双目摄像头。RGB摄像头获得RGB信息,双目摄像头配合芯片获得物体的深度信息。然后数据传输到xbox中,由软件进行人体姿势的识别。
双目摄像头的关键技术是由一家以色列的公司Prime sense提供的。并不是采用的双目摄像头标定的方法,那两个摄像头其实是红外摄像头,用了一套他们的专利技术。说是利用红外线对场景进行编码,然后另外一个摄像头读取编码信息进行深度图的计算。
引用cvchina的文章如下:
用计算机视觉的方法获得场景/物体的深度就是各种三角化(激光+摄像头,双目,投影仪+摄像头等等),当然还有depth from focus,coded aperture之类的技术。近来越来越热门的深度摄像头(depth camera)多采用的是另外一种办法,TOF(time of fight),利用主动射出的红外光往返的相位差来测量深度。primesense为微软kinect中定做的深度摄像头又用了另外一种思路,一种被primesense成为light coding的专利技术。按照这个博客上的内容,kinect通过IR头投射一些“随机”点阵,然后只用了一个普通的CMOS传感器来扑捉这个点阵。按照文章里说法,随机其实并不随机,一些模式在整个投影图案中反复出现。简单来说,当场景的深度发生变化时,摄像头看到的点阵也会发生变化,通过这个变化就可以推断出深度信息。当然事实上可能也没有这么简单,有兴趣的可以去读一下primesense的专利。
http://www.wipo.int/pctdb/en/wo.jsp?WO=2007043036
http://www.freepatentsonline.com/7433024.pdf
很早的时候,在cvchina的群里面跟他们讨论过这些东西。发现机器视觉最最鼓舞人心的就是在下一代人机交互这一块,现在kincet算是开了一个好头。拿到深度图之后,humam pose estimation的论文如下,有兴趣的同学可以看看:
Real-Time Human Pose Recognition in Parts from a Single Depth Image`
kinect刚出的时候,有一帮爱好者直接将驱动破解了,有一个open kinect项目。 我之前看过他们的代码,后来微软也做了解释,说是就是开放个大家用,因此也并没有怎么加密。后来微软发布了官方驱动的支持:Kinect for Windows SDK
国外有非常的人在Kinect上面做出了很多非常有意思的应用。经过我这两天的试完,的确是非常给力的,但是反映速度还有待提高,又但是,不得不承认,识别精度还是比较让人惊讶的。有兴趣的同学可以自行进行研究了。
PS:我觉得我这帖子,就是链接大放送。