mile米乐m6mile米乐m6今年6月27日,UI设计巨头Figma召开了一年一度的产品发布会Figma Config,被誉为设计界的“春晚”。
Config大会第一天的Check in故障了大概十分钟,会场门口排起了长队。排队间隙,不少人看到一辆广告车围绕着会场来来回回地兜风。
这是Motiff的小心思。作为Figma“名不见经传的友商”,直接选在Figma的主场向这家行业巨头“宣战”,这种出场方式更能激发人们的好奇心与关注度。
Motiff对很多人来说这是一个陌生的名字,但若提起另一家公司猿辅导,相信大家一定不陌生。Motiff与猿辅导的关系是,他们来自同一家母公司猿力科技,在北京望京的同一栋办公楼上班。
Motiff成立于2021年10月,中文名为妙多,这位UI设计领域的SaaS新秀,把Figma视作唯一的对手。过去两年半,Motiff一直在埋头做产品研发。今年6月5日,Motiff在新加坡面向全球发布。
Figma在UI设计领域是巨无霸一样的存在,估值200亿美元(一年半前Adobe的收购价)。Motiff真的有能力挑战Figma吗?
从世界上第一台PC诞生到现在,每个时代都诞生了UI设计工具的软件产品,从像素时代的Photoshop,到矢量时代的Sketch,再到协同时代的Figma。Motiff认为,AI时代将会诞生新的UI设计领军者,AI功能将会是最核心的价值。
Motiff已经推出了三大AI功能,包括AI工具箱、AI设计系统以及Motiff妙多实验室,分别面向UI设计的不同场景。近期,Motiff还发布了自研的Motiff妙多大模型,是继苹果Ferret UI和谷歌的ScreenAI之后,第三个面向UI领域的垂直大模型。
整体方向是要看大的商业机会,然后再看自己的企业调性。猿力科技长期以来形成了三大能力:第一是产品研发,我们做出过相当规模化的业务,沉淀了大量的人才;第二,对于品牌的打造,产品与用户之间的连接,我们有自己独特的见解;第三,我们有规模化的服务团队,擅长在业务快速扩张的过程中规模化地推进。
在当时的节骨眼上,我们认为SaaS的匹配度非常高,也是一个长坡厚雪的生意。既然可以做,再深入去看到底有什么机会。
第一个要回答的问题是通用性还是专用性的问题。通用性SaaS就是业务SaaS,比如CRM、IM云文档,都是很大的机会,但行业内已经有实力雄厚的公司,已经不是我们的机会了。
专业工具就不一定,我们发现国内的专业工具SaaS很少。过去三十年,专业工具SaaS公司换了一批又一批,但基本上被北美公司垄断。
我们认为专业工具在国内市场有很大的机会,还有一个关键因素是AI。2021年Motiff几乎所有的工程师都在使用Github Copilot。受此启发,结合我们在产品设计领域的理解,我们判断专业工具结合AI会形成新的市场机会。
张昊然:单个产品的天花板不太可能产生巨大的生意。最终要做成品牌的话,专业工具的商业化策略就是做多款工具,这已经被验证过,比如Adobe。做成多款工具的前提是切入生产流程的上下游,界面设计就是一个不错的切入点。
而且,我们团队很多人有界面设计的背景,它本来就是互联网开发的重要一环。比如我们做猿辅导时,在手机端、网页端、Pad端都做了很多UI设计的工作。我们本身就是这方面的用户和专家,对它的理解也更强。
张昊然:我觉得可以这么说。任何一家大型的产研生产线的团队,如果想转型做这件事,应该还是具备一定认知的。但有这些积累的团队M6米乐APP,不一定会选择从零到一去做这件事。
集团公司对这件事的态度并非机制,而是会长期投入。一开始做这件事,我们对困难是有预期的,会保持10年以上的耐心。
张昊然:项目建立之初,更多的是产研团队的投入,就是传统互联网行业大家理解的产品经理、产品设计师、前端后端。因为Motiff在做AI,还有对应的AI工程师、测试团队等。
相比数量来说,质量更为关键。我们主要考虑两个因素,一是人才密度要超配,Motiff基本上把公司之前斑马、猿辅导等核心项目的顶尖的产品研发都聚集在了这个项目。因为我们面临的并不是经验主义的问题,而是要在复杂的世界解决复杂问题。说实话,今天回过头看,我们最开始对这个项目的困难预期,与我们实际遇到的问题之间,还是有很大的GAP。
第二个更为关键的因素是工程化团队。产品团队和AI团队之间如何配合,这是非常隐性的话题。很多时候大家其实没有办法直观地理解工程化的复杂度,但对于一个组织来说,我认为这是最重要的一环。
甲子光年:Motiff把产品功能分为了协同设计的“基础功能”与MotiffAI的“AI功能”,两边的人才投入是怎么划分的?
张昊然:Motiff成立两年多的时间,前期是七三开:70%的基础功能,30%的AI功能,现在可能反过来成为三七开了。因为基础功能做的事情是边际递减的,肯定越做越少,更大的机会还是在AI上。
张昊然:Adobe是一个真正实现专业工具矩阵的巨无霸,有非常多款软件,每一款软件的用户其实都不重叠。
Figma是一个相对专一的软件,从UI设计起家,当然现在也切到了更上游的白板和更下游的研发模式,但还是基于界面生产。Adobe想要收购Figma,你可以理解为Adobe失守了UI界面设计这一领域,他想要拿回来。
如果是Vision(愿景)层面,Motiff肯定想成为Adobe或者微软这样的公司。但务实一点来看,跟Figma肯定是最直接的竞争。对标肯定只对标最好的公司。
甲子光年:从像素时代的Photoshop、矢量时代的Sketch、协同时代的Figma、AI时代的Motiff。驱动这些工具演变的因素是什么?
张昊然:从Photoshop到Sketch最本质的变化是移动互联网的到来。这件事的拐点就是iPhone与安卓手机的兴起,世界上有了非常多的手机界面,需要非常多的App,这些App需要有生产人员与生产工具来生产。
原先的Photoshop是一个通用软件,不只是生产屏幕界面,还可做图像处理。Sketch能够脱颖而出,本质上是专用最终战胜了通用。当社会中有一个生产资料需要巨大的人力和物力投入时,专用工具一定是比通用工具更好地满足专业用户的诉求。也是从移动互联网之后,UI设计师变成了一个职业。
Figma的机会是云服务发展带来的协同。Figma之于Sketch,就是在线文档与离线文档的区别。设计是一个上下游协作非常复杂的场景,线上协同对于效率提升是质的飞跃,这件事必然发生。Figma与Sketch的成立时间差不多,但Figma前三年没有任何用户,技术不是特别成熟,处于Demo状态。但Figma一开始选择了面向未来的产品,最终的市场拐点是疫情,打开了在线协同的市场。
而现在,AI是一个新的巨大的变量。无论谁来总结这件事,是比尔·盖茨还是马斯克,大家都会认为软件会发生巨大的变化。当然这会有一个过程,Motiff很愿意成为这个探索过程中的先行者。
张昊然:AI肯定会带来新的机会,但可能不像是移动互联网那样海量的机会。移动互联网有了手机这个新的介质 ,所有人都要在手机App上做事情,它孕育的不止于界面设计,还有一大堆商业机会。
人机交互确实是行业内热议的话题,比如从GUI(图形用户界面)到LUI(语言用户界面)的转变。但我的看法是,AI不是新鲜事,Siri很早就出现了,只是说模型的进步让AI的能力变得更强。以前Siri这类产品的交互形式不普及,是因为还不够智能。
但我觉得,AI只是原有交互形式中一个形态的变化,对于界面交互并不是巨大的颠覆式的增量。Motiff做这件事的机会不在于交互方式的变化,还是像Figma的逻辑一样,是生产力本身的变化,而AI加速了这一过程。
张昊然:我觉得Copilot是一个很好的总结,但我对AI原生的态度稍微有一点点排斥,它更像一个包装出来的概念。经常从媒体上看到这个概念,有一次我想找找到底是谁说的,也没有找到准确的来源。
我觉得AI原生不是一个好的抽象总结。有时候我比较反感它的原因是,这是一个“拿着锤子找钉子”的思维。很多AI原生的方,就是觉得有了大模型的能力,我们能否用这个能力实现什么东西?
但大家最终做一个产品或者一个工具,还是要解决用户问题,不是只有AI能解决的问题才是好问题。用户的痛点与需求大部分情况下始终存在,更多时候不是因为技术的发展带来了需求的变化,而是让需求对应的解决方案可被重新评估。
张昊然:因为我们受Github Copilot的影响比较大,我觉得Copilot跟AI结合确实是一种比较强的应用形式。
我对Copilot的定义是,如果一个东西能够基于工作流中的上下文进行推断,并且由AI辅助进行一些输出,那么就构成一个闭环的Copilot。在用户对应的作业环境里,AI能和人同步共享信息。共享信息的同时,Copilot能和人一起协作。这是一种很好的概念,让AI参与到与人协作的视角。
AI的设想会构成对产品设计的思维模式,但并不是说我们一定要包装成Copilot的形态。最终的交互还是要看怎么做更符合用户习惯,这是一种权衡。有时候你会发现召唤一个Copilot非常fancy,但实际上让用户多操作两步其实没有意义。
比如,Motiff设计一个拼写检查功能,究竟是需要人机对话的方式来帮你检查,还是直接显示被纠错的区域,后者或许更务实。
张昊然:你说的可能是对的,我们对这件事的理解也在变化。B端的专业工具跟C端产品很不一样的地方是,生产工具要想做AI,就必须得构建在原有的一套东西上。C端AI产品的一个特点是,没有AI这个产品就不成立,而生产工具却是AI让产品变得更强,但产品的本质还是原先的生产关系。
张昊然:我个人的主观评价是比较快的。主要还是横向对比同类产品,Motiff是用了更短的时间达到了更好的产品交付质量。虽然我们一开始的预期会更快,但最终还是得尊重事实。
张昊然:做这件事的难度在于,一个专业工具的壁垒之所以比较深,是因为基础功能必须满足用户必要的诉求,这些必要的基础功能集其实是非常大的工作量。
比如做一个钢笔工具,通过矢量的点去画线,矢量的路径怎么做?曲率怎么弯?画一个矩形,如何加描边?如何填充颜色?如何画圆角?这些事情要全部在画布上重构一遍,每一个功能的逻辑都会非常复杂,这件事是绕不过去的。
而且,这些基础能力,由于前一代工具的积累,使得后来者的必要成本会变得更高。Figma有的基础能力,大部分你也需要有,否则很难让新用户接受你。所以,这些能力全做下来就需要两年多的时间。随着我们投入的精力和时间越来越多,我们其实更能理解为什么Figma有很强的护城河,以及Figma的估值这么夸张。主要还是背后要投入的工程、技术是非常精细与复杂的。
AI能力其实是逐步累积的。对于生产工具来说,大部分AI能力还是得建立基础能力上。我们在项目开始时就对AI有很多想法,但实际落地AI功能也是在基础功能完善之后了。
甲子光年:你们在2021年就是从AI的角度思考的,但那时候没有大模型。当时的AI技术能做出好的AI产品吗?
张昊然:在ChatGPT发布之前,还很少有人谈论大模型。我们当时在想一个问题,包括深度学习在内的AI,已经能解决专业工具中非常多的问题(比如Github Copilot是2021年发布),为什么很少有人做?例如Adobe为什么不做AI?
这是我们非常强烈的疑惑,而且一直都在。后来对这个疑惑释然的原因,是意识到了企业投入一件事的决心与专注度。比如,大模型出现的时候,Adobe其实迅速地推出了很多AI产品。当一件事没有足够的关注度时,巨头的专注力还是在原有业务上,对新业务会的投入会慢一点,或者长远一点。
张昊然:肯定会有,本身就需要动态地看待机会。对于产品规划来说,没有人能一下子做两三年的规划,一个季度的规划是更务实的。ChatGPT的出现,一个显著的好处是加快了推动市场的进程,用户尝试的门槛降低了。
要在AI上做创新,就得回答一个问题:AI到底能为现在的设计师做什么?这会有技术可行性和最终收益的权衡。Motiff长期有用AI来实现的功能场景list。大模型带来的最大的变化,是使得技术可行性被重新评估。
比如,原先大家不太可能想象的场景是,输入一段话或者画一个草图,AI就能生成UI界面,原先的深度学习模型没有这样的场景,但今天的大模型场景能做到了。
PTF的逻辑主要是产品与技术的结合,达到用户可用状态的逻辑。这件事取决于两个点:一是我们自己对用户场景的理解与观察,二是非常依赖于产品设计人员与工程人员之间的配合。简单来说,就是产品设计人员懂AI技术,AI人员懂产品与业务场景。如果大家都只是纯粹的各司其职,很难迸发出真正令人满意的ideas。
这件事并没有最优解,就是通过组织流程最终来解决。最直接的解法是,复用过去在教育领域的成功经验,借鉴之前的组织方法,将一批历练过的优秀人才配置到新项目中。
张昊然:我认为是“现在可用,长期可累进”。如果真的达到Fit的状态,那么当下一定是有效的,不论是一个大功能还是小功能。而长期来看,这套方案能够通过数据的积累,功能的优化,技术的发展,让能力越来越强。
我们比较在意产品的长期优化与迭代,不太信奉第一把就能完全做对,我们过去的成功经验也是如此,所以要不断地保持变化与观察。
张昊然:专业工具有一个特点,就是技术的演进定义了一个新的产品时,如果后来者只是模仿跟进,其实胜算很低。有一个很有意思的事,在疫情爆发前后,Sketch与Figma的市场占有率发生了颠倒。2020年之前,Sketch大概占据UI界面专业用户的80%,但到了2022年,就只剩下20%了,Figma占据了80%。难道Sketch没有意识到协同的重要性吗?肯定意识到了,但后发地做这件事,已经于事无补了。
所以,产品力要出现在最关键的时间点。过了那个时间后,更长期的竞争还是商业上更综合的维度,包括怎么稳固产品线,怎么加深壁垒。
至于同质化的竞争,其实在界面设计这个市场没有那么强。大家往往也各有差异化,最终还是看市场有多大。
张昊然:原因其实比较简单。举个例子,Motiff做了一个功能叫AI设计系统,就是设计师用AI来帮助他整理设计稿中的组件——组件是指按钮、对话框等UI元素。原先,这是一个很繁琐的工作,现在通过AI来实现,这就需要AI具备非常准确的识别能力。
做这件事有多种路径,原先的深度学习模型可以做,把深度学习模型与大模型结合起来也可以做,最终要看AI的识别率。同时,不能让用户的等待时间太久,识别速度也非常重要。
我们发现,业内的通用大模型比过去的深度学习模型效果要好,但仍然达不到我们的需求。原因是通用模型中没有太多UI设计领域的专业数据,但我们自己是有的。所以,把专业的数据给大模型做二次的训练,我们就能得到一个效果更好的垂直模型。
同时,日益成熟的技术让很多领域训练出了效果不错的专业大模型,包括医疗、法律、教育等,这为我们去训练一个UI领域的大模型注入了更多信心。
张昊然:如果我们想从头开始训练一个专注于UI领域的多模态大模型,需要经历三阶段训练——预训练、对齐训练、指令微调,并加入一定比例的UI领域数据。但这样做面临几个显著的挑战:
第二,从头开始进行训练不仅耗时,而且成本极高。例如,当前多模态模型中常用的视觉编码器(如OpenCLIP)的训练需要数百亿的训练样本。此外,训练过程中的各类问题可能导致不得不重新调整和开始,进一步延长训练时间。
从更快赋能业务的角度来看,从头训练一个领域特定的模型并不是最佳选择。我们基于现有的通用多模态大模型进行调整和优化,以适应UI领域的需求。
Motiff妙多大模型选择的是最经典的整合专家模型,也就是将一个预训练好的视觉模型(Visual Encoder)和一个预训练好的大语言模型(Large Language Model),通过一个模态转换器连接起来(Connector)。
现成的UI领域数据尤其是手机端的高质量数据,极为稀少。为了弥补这一缺口,我们采用多种方法,包括人工标注、伪标签生成、领域知识蒸馏等方式,收集了一批高质量的UI领域数据。
甲子光年:Motiff妙多大模型是业内第三个UI大模型。此前,苹果发布了Ferret-UI模型,谷歌发布了ScreenAI模型。你们跟他们的关系是什么?
第二,对于他们来说这是自洽的。目前谷歌与苹果就是软件量分发最大的两个平台,开发者生态是他们非常关注的。很多研发工作台之类的产品,都是苹果与谷歌开源出来的产品。
UI领域与整个移动端产品的生态息息相关,包括操作系统级别的研究,都要依赖UI的能力。比如苹果里有一个辅助功能,就是面向视障群体的支持功能,跟界面设计有很大的关联。
张昊然:我们进行了系统全面的评测,有五个常用的UI界面场景中——ScreenQA(界面问答)、Screen2Words(界面描述与推断)、RefExp(像素级定位)、Widget Captioning(部件描述)、MoTIF-Automation(交互导览)。
评测结果表明,通用大模型(GPT-4o)的能力明显弱于领域模型(Ferret-UI、ScreenAI和Motiff妙多大模型),而Motiff妙多大模型在这些指标上明显超越了苹果的Ferret-UI模型,整体能力逼近了谷歌的ScreenAI模型,在某些能力上甚至超越了ScreenAI模型。
张昊然:策略上不太一样。目前海外还是在早期的品牌认知阶段,更to C一些。因为to C的链路更清晰,就是PLG的模式。Motiff本身是一个协同产品,如果有一个用户满意,可以邀请团队来使用,PLG的模式效率更高。Motiff还没有非常充分的国际化销售团队,这是一个比较难的事情,需要逐步构建。
国内的话,我们想得比较清楚,就是做大B。大B企业很多都是Figma的用户,现在还没有做迁移,当然可能也没有那么急迫。如果大B企业再去选择一款新的产品,我觉得Motiff的竞争优势会更大。
张昊然:有一个比较务实的逻辑就是市场空间。如果你去看专业工具在国内的市场空间,没有那么大。同时,如果在国内做,可能不得不做本地化部署,但我们现阶段又不想做。
张昊然:第一个原因是,我觉得本地化部署不是面向未来的产品形态M6米乐APP。本地化部署其实是一个中国特色+世界500强特色,但实际上整个国际市场,SaaS云服务才是更敏捷的方式。本地化部署会拖累产品迭代的速度,因为要兼顾非常多的本地化的版本,使得我们在前期跑得很慢。
第二个原因是,本质上本地化部署与AI有一些相悖。AI的本地化能解决的问题很有限,因为AI的能力是依靠云服务去提供的。如果我们坚信AI时代的变化巨大,可能本地部署的优先级就要滞后,而国内市场我们肯定不能很好地满足。我能理解中国的很多央国企的诉求就是这样的,而我们也没有意图去改变这个市场,那就只能去找到更匹配的市场,因此要站在全球视野上去看。
从产品本身的属性来说,工具属性越强,业务属性越弱的产品在不同国家中实践的分化会更小,也更适合出海,Motiff比较符合这个特点。
张昊然:其实很难给到一个量化的数字。但我觉得,如果Motiff能达到1000万美元的ARR,这个项目才算能够立得住。如果能立得住了,再去考虑扩展上下游产品线的事,最终的SaaS的目标肯定比这个数字大。
张昊然:产品设计的上游是业务人员,下游是研发人员,这里面其实有非常多的工具化的机会。Figma也在做这件事,比如推出了研发模式,向研发人员提供了新的功能。Figma培育了市场的付费习惯,如果Motiff能做出一些差异化,同样也能从中受益。
Motiff已经在做这方面的跟进。在付费版本里,既有设计席位,也有研发席位,团队可以按需选择。我们也发现在研发领域,同样存在了大量机会是AI可做的。
张昊然:定价策略跟产品的第一性原理有关系。我们希望产品的最终价值,是AI能够改变生产关系与生产力。这是一个AI的设计工具,如果我们笃定能做成,那么最大的价值就是AI生产力,最多的价格就应该来自于最多的价值。
那么基础功能怎么收费?这是一个商业策略的问题,因为Motiff做得更晚,价格就想做得更激进一点。专业工具的基础功能有一个特点,就是上一代工具的主要能力会在下一代工具中体现,而人们对于下一代工具的预期是标配能力——没有它不行,但好像又不太值钱,比如文档工具的文本加粗、对齐、更换颜色,如果没有肯定不行,但这些能力并不能构成价值点。
设计工具也是类似的道理,基础能力比如布局、各种图形工具、文本等是基础的标配,但这些标配会回归到一个更朴实的价格,可能是更合理的。至于长期来看要不要干脆打包成一个定价,让用户更容易理解,还需要再观察。
张昊然:我们肯定希望广泛地听取用户对产品的建议,不管是正面还是负面的评价。有时候负面评价是很好的,只需要保持一个良好的心态去理解它。但我们也听到了很多正面的评价,甚至是过度的盛赞。
产品发布之后,有的用户对Motiff的预期非常高。比如现在输入一段文字能生成UI界面,将来是不是把整个App都生成了?但事实上,这个方向要迈向终点还其路漫漫。对于一项新技术,很多时候用户会过度预期,有时候产品会犹豫要不要去迎合这种过度预期来获得更多关注,很多时候也不是一个容易的决策。
我看到了很多AI产品,做出了一些“莫名其妙”的功能,但可能过一段时间后又下线了。比如很多海外产品通过套壳大模型,做出了一些很fancy的东西,但用了几个月之后也不再用了;我们自己是Notion的用户,它的AI会也有这样的一些功能,后来他们也做了一些纠偏。
张昊然:在国内,发布之初Motiff就收获了比较大的外部客户,这是一个非常重要的里程碑。因为国内的中大型企业,实际上很少能从Figma迁移到国产工具。一些同类产品,要么比Motiff做的早,要么是做了本地化部署。Motiff跟Figma一样都是云服务的模式。
这一定程度上说明了Motiff的产品竞争力在国内有很强的优势。因为市面上就那么几款工具,专业用户花上一到三天的时间,就能完成实际业务场景的详尽测评。通过测评结果就能做出选择。
在海外,我们初步验证了在获得用户上是比较容易的,因为Motiff确实在AI上有一些差异化的点,对专业用户具备一定的吸引力。
接下来的挑战主要是商业化的挑战,很多用户现在是Figma的用户,他们到底是从Figma迁移过来,还是与Motiff并行使用,这是我们接下来更多关注的问题。
张昊然:迁移需要提供足够的增量价值,让迁移总体的增量大于带来的损失。比如,一个大客户可能有几十个设计师、几百个研发,从Figma迁移到Motiff实施下来也就两周,并不是一个特别大的成本。但海外市场还有品牌的积累,用户不一定有迁移的动机,毕竟Figma是一个很强大的品牌,也做了很多年的产品。
如果是并存的话,要看Motiff与Figma分别提供了怎样的价值,需要找到产品的差异化。如果同质化的部分只能选其一,而差异化的部分能串起来使用,也是很好的路径,但这个路径需要验证可行性。
张昊然:海外已经非常稀松平常了。有了AI产品之后,你会发现付费的单价都很夸张,很少见到一个月19美元以下的产品,有的甚至定价到29美元、49美元,付费率是比较强的。关键点是能不能做出价值。
甲子光年:把AI作为核心价值定价的前提是保证AI能力的领先,但AI产品的能力会不会很快拉齐?
张昊然:知晓跟行动是两件事,也是分水岭。这个时代我觉得没有人逃避或者否认AI的价值,但怎么去行动,最终还是要看团队。我觉得,Motiff团队持续、专注地去做这件事,就是最大的优势。Motiff的人才是世界领先的,在AI、UI领域的专注度也是世界领先的。
我今年其实去了Figma Config的现场。在去之前,作为“友商”我其实很忐忑,Figma是一个很强的团队,聚焦了北美最顶尖的人才,资金也非常雄厚。Motiff怎么才能占领先机?
大概有两件事增强了我的信心。一是Figma今年发布的AI能力低于我的预期。Figma做的部分AI功能,我们之前也想过,但总觉得痛点不太“痛”;另一部分AI功能Motiff也做了,甚至做得更好。这是一个客观评价,因为我们实际测评过,不会自欺欺人。从这个角度上说,我会释然一点。
另外,我们聊了一些Figma的前员工,发现Motiff对于AI的决心与投入,会比他们更大。这可能源于他们作为一家商业规模庞大的公司,要不要大量投入AI,面临着选择难题。我们的压力反而会小很多。