John | 曲

Reflection in Transition

各种眼镜有什么好

CES-Asia2018观后记上篇

曲政 / 2018-06-20


上周四和周五,我去参观了亚洲消费类电子展。展览在浦东新国际博览中心,占据N1~N5五个场馆,为期三天。

img

开展时这里人头汹涌,结束时也有人拍照留念,等不到无人时。

我去看展,因为朋友推荐。之前约了他一起去体验HTC Vive,但是他事情忙,一直没有成行。周二他给我信息,说这个展会里有很多VR产品。我周四一天和周五半天,主要是看视觉类产品,这里记录几点阶段结论,作为CES观后感上篇。其他的有趣产品,记录在观后感下篇。

眼镜的样子

包眼睛的都是VR吗?

一般来说,包眼睛的很重的东西,是虚拟现实技术,称为VR头显。

但是还有一种产品,外形类似VR头显,但是很轻。

img

展台的小妹正在自己体验这产品,也许是科技含量小,少人问津。

PS:淘宝有充电宝大小的编写版,老同事们可以考虑一下。

它只是一个壳子,隔绝外部干扰光线,插上手机全屏播放,让人有影院一般的沉浸感。在高铁和飞机旅行中,这种体验可比举着手机好多了。

混合现实有人能做到吗?

我没发现有产品做到了高度的混合现实,即把真实世界的物体投射到虚拟世界(参考混合现实(MR)和增强现实(AR)有什么区别? - 邓波的回答 - 知乎 )。也许是对现实建模比较难。

img

这个模组比较大,不是装在手机里的。

我遇到了Lumentum的展位,但是没有想到问他们这个问题。他们展出了芯片和光学模组,没有宣传与苹果合作的激光点投影人脸识别技术。

所谓SLAM是什么技术?

同步定位与地图构建SLAMSimultaneous localization and mapping)是一种概念:希望机器人从未知环境的未知地点出发,在运动过程中通过重复观测到的地图特征(比如,墙角,柱子等)定位自身位置和姿态,再根据自身位置增量式的构建地图,从而达到同时定位和地图构建的目的。参考即时定位与地图构建。

美国的Xvision团队展示了他们的模组和算法。

imgimg

我问了半天才理解,这两个摄像头是做什么的。不是构建现实世界的三维模型,它不是扫描仪。它只是抓去特征点,红点代表近,蓝点代表远,绿点代表没有用(没用标记干嘛,不懂)。经过计算,它能知道自己在这个空间种的位置和姿态,俗称6自由度,然后你随便动镜头,就能画出在空间中的运动轨迹了(红色线)。

img

我的iPad可以跑AR游戏,比如让一个小动物站在卡片上演奏乐器。它识别平面应该不用这么复杂,毕竟pad只有单摄像头。

“SLAM 技术会是一场泡沫吗? - Pickles Husky的回答 - 知乎“里说这个技术靠积累,硕士在美国找工作很吃香。无人机避障、扫地机器人路径规划等产品,都需要有各种SLAM算法支持。

带眼镜做远程指导值得吗?

EPSON的眼镜我最喜欢。它的眼睛腿能伸缩,可以适应不同脑型,鼻托够长,不用摘掉自己的近视镜。

img

有位大叔拍了我带眼镜的样子,我也拍了这位大哥。

img

上图眼镜连着的线,就是连接本图中黑色的盒子。它是主机,含处理器和电池等模块。要眼镜轻,就不能完全无线。

但是它太贵了:BT-300要7000块,京东6199,BT-350防水,要18000。会议板模式下,增加一个id,加5000元。

远程指导,这个维修服务的利润空间要够高,才能摊平这个成本。

会议的话,参会的人单位时间要够贵。

教育的话,眼镜中显示的内容要够贵。

总之就是一句话:人和物值不值。

录像眼镜有什么用?

要什么投影?有第一视角录像就够了。

SeeU的智能眼镜,集成32G存储,720p,3.5小时录像,足够了。

img

没有投影功能,可以方面更换镜片框架,一秒完成。近视、远视、户外,都很帅酷。

img

CEO没有架子,给我展示手机里他录的服装走秀现场,很清晰。

img

淘宝查了一下,价格偏高,1899元。同类录像眼镜有200~400元的,不知道SeeU强在何处。

img

淘宝同类产品下有人留言:户外还好,室内光线不足时,视频颗粒感很强,有的甚至模糊得不能看,一米外不辩人脸。

图示头盔上的补光灯可能很重要吧。

纯投影眼镜有什么用?

要什么录像?给我清晰的投影就够了。

img

一个110克的眼镜,加上一个指环小键盘,操控视野中的魔方。灵犀的镜片真的很薄。

img

高老板跟我说,你们咋都来问工业应用。我以为是消费类电子展,只带了观影产品。小妹跟我说,你看到的屏幕有点不够量是不,因为工程样机没有配墨镜。我用手蒙住眼镜,果然电影清晰多了。

img

样本上说:可播可录。但是这得多少钱呢?老板说,我们是合作开发,看你的量了。别不够我们给工厂下单的。既然他们办公室在苏州,我想去那里看看。

微软的Hololenz什么样?

在商询的展台看到Hololenz的真身,外观挺帅,不知道功能如何。

img

为什么把给人的头盔架在微单上面?

如果我还是销售,还有机会进主机厂,很想拉着他们一起去拜访客户,探索产业应用的场景。

视觉的信息

可以直接拍照测量吗?

一个镜头加一束激光,在一张照片里,测量三维尺寸。量房的人有福了,不用登高伏低地摆pose;选家具的人有福了,不用拿个卷尺四处拉。

img

老板说,越近越好。我说,我常常用手机拍出大头人。他说:我们的算法都考虑到了。

我的师父有个绝活:看着设备或零件徒手绘图,配上卷尺和板尺,就能大致出图。

先拍照,后测量,这是便利。但也有不足,因为没有现场确认尺寸,可能漏掉视图。

产品旋转模型怎么做的?

img

原来是多个相机同步拍摄,后期合成。这家公司就在我原公司大楼的隔壁,小哥还常来我们这里的食堂呢。

一个产品十几分钟就好了。

大公司产品多的话,可以自己弄一套。

国内提供扫描服务的公司不多。

全景视频相机做什么用?

img

电脑软件可以选择展开视图和球状旋转视图,也许带上VR头显,能有沉浸感。

这是我老家的公司,广告页上是深圳的名字。

油库厂区管理严格,就用全景视频做培训。

华为的健身镜能做什么?

没见哪家眼镜有手势识别,个别的有遥控器或者线控。

img

这位哥哥给我演示了此次动作,可惜当时没有拍照。

华为的健身镜可以识别大手势,用大手势做鼠标。它用简单模型提醒用户做举哑铃凳健身动作,分析是否做到位。

我希望它能在镜子里我的影子上,显示出正确的姿势形态。我喜欢看到我做到了的样子,同时也乐意对比自己哪里做得不到位。

观后的想法

设想:眼镜类产品的普及应用是什么?

我没有看到让我眼前一亮的眼镜应用。

杀手级应用,就像近视镜和花镜,带上之后,整个世界都不同了。

我想象的应用场景:

  1. 赛亚人的战斗力值测量眼镜,马上告诉我谈话对象的背景信息。

    img

    本图来源于网络

    这要求识别对象,从数据库里调取相关信息。我国的人脸识别很高效了,只是背后的个人信息不够丰富。

  2. 协作修理现实世界,我能看到同伴的看到的侧面。

    img

    本图来源于网络

    这要求快速压缩和解码,互相实时直播。多机位直播已经做到了同步,只是再发到各通道就好了。

  3. 在公共场地操作一台设备,多人共享一个虚拟世界,各有立场。

    img

    本图来源于网络

    这要求各台设备与云端模型的交互都彼此可见。听说Apple的ARKit2做到了多人同玩一个搭建游戏。

分析:眼镜类产品的瓶颈在哪里?

两端都有瓶颈,一个是录,一个是播。

录什么,录下来有人看么?

现在相机和手机这么普及,但是视频和照片的观赏率肯定不如以前。手机照片,如果不花几倍的时间做后期处理,都不好意思发在朋友圈;如果不能发在朋友圈,恐怕都不会去看第二眼。

视频就更鸡肋了。观赏者不能一下子抓住精髓,总要等它播到要点,较长的视频很少有人坚持看完。高清视频那么大,在电脑存不下,过一阵子就删除了。

什么事情值得记录,怎么处理才好保存呢?

特殊的事件,才值得记录。比如极限运动,常人没有条件体会。

精华提炼过,才保存。比如裁剪压缩,删掉不相关的部分,模糊掉快进掉不重要的部分。

播什么,干嘛呈现在视野里?

我观察世界都来不及,怎么还提供额外信息?即使需要,这些信息我不能看手册、看电脑、看手机吗?干嘛要把信息重合在我的视野里?

我想有两条路。

一条是我的视野不重要,眼镜内容才重要,观影走的这条路,可以完全遮蔽掉外部光线。

另一条路是视野内容更重要,但是需要眼镜提供相对应的额外信息。比如菜谱步骤、用量的提醒。

结论:我用什么方式采集数据?

我的场景是记录一门手艺的演练过程,由一个人按照作业指导部署和记录,由后台人员剪辑视频。

  1. 第一视角摄像眼镜,最好有实时测光和自动对焦。我把它配发给演练者。
  2. 现场全景相机视频,记录环境。我把它安装在现场,作为后续补充镜头。
  3. 固定位相机,指向关键部位细节。
  4. 带激光测距数据的相片,根据场景变换程度,自动拍照。

有这四个数据源的信息,我就可以尝试完整表达手艺的精微感觉了。


以上,是我看CES-Asia2018展的观后感上篇,围绕眼睛能有什么好科技。下一篇,我会记录一下我遇到的几件好货。

贝贝 2018-06-20 周三