Welcome to See Us

* 这些是虚拟合成的人脸,本站提供多套不同风格的人脸模型,以及持续思考对应的落地玩法↓
会说话的数字人
* 技术子方向:Audio-Driven Talking Head Synthesis
会唱歌的数字人
* 技术子方向:Pose-Driven Talking Head Synthesis
会表演的数字人
* 技术子方向:One-shot Face Swapping
二次元的数字人
* 技术子方向:Face Style-Transfer
如果您有什么问题是我可以帮您解决的,欢迎您通过QQ:312863063等方式来联系我,或参见与我合作
我仅聚焦于做图像视觉的生成技术(基于GAN/NerF/Diffusion等)这一块,其他的方向我可能并不精通
思考:为什么人们愿意为数字人买单?
这个问题还挺重要的,有一点拙见想表达一下。我觉得没有人把这个问题讲清楚过,很多人都是一股脑在做。
我身边有做技术的人也有做商业的人,他们关注点还是挺不一样的,比如要么是技术很fancy,要么是好讲故事拉投资。但我觉得真正重要的是用户的角度——假如我啥也不懂,我看见一个数字人,我觉得这个技术很牛很逼真,可能我点赞转发一波。。但我凭啥掏钱买它??它能给我提供啥服务呢?
目前看有两种理由,第一种是我喜欢TA(TA是个偶像),为了给TA应援或者得到TA的定制祝福语等付费,这种有市场但是不够有黏性(用户离开TA照样生活);另一种理由比较难找,就是那种真人搞不定只有数字人能搞定,同时这个任务又不得不做的场景——难找是因为目前数字人还处在模仿真人的阶段(能力复刻于真人),但找到这个点非常重要。
我能想到的短期刚需场景包括:1. 照片聊天器:家里放一张人物照片,按一个按钮之类的,他的嘴巴能动能说话,这个很酷哦,因为总有我们思念的人,单纯照片还不够寄托相思之情;
2. 数字打工人:利用面部驱动+唇语合成制作一个数字人替身,让替身为真人打工(卖方要偷懒+买方要内容)。比如明星授权面部版权合成祝福语卖给上百个商家;销售授权面部版权合成一百段介绍视频传播给一百个客户;甚至我可以买一个“我”的替身,这些都是长期且广的需求点。
长期的刚需场景包括:1. 元宇宙的技术基石已基本确认为3D数字人,这是每个民众都必须且只能用到数字人的地方(达成数字孪生),它能推助元宇宙渗入到人们生活的每一处。
总而言之,只有找到真人搞不定的而数字人才能搞定的场景才能称之为商业化。目前已推的像新闻播报/手语翻译/虚拟人带货等都属于噱头(它们是犀利的功能但一定不是商业化),因为这些是秀肌肉的逻辑而不是做价值服务的逻辑。数字人赛道的正确落脚点一定是在挖掘用户的使用意愿上,即填空题的命题格式为:“如果我不用动脑子就能实现__”,把这个空填好才算功能型数字人转变为商业型数字人。长远来看,谁能把数字人制作流程精简为一个即插、即用、即得的接口,谁能让用户产生简单、快乐、爽的体验,谁就会成为数字人时代的赢家。
—— 写于20220507