新知榜官方账号
2023-10-03 18:02:28
UIzard Technologies是一家初创公司,训练了一个神经网络能将图形用户界面的截图转译成代码行,成功为开发者们分担了部分网站设计流程。令人惊叹的是,同一个模型能跨平台工作,包括iOS、Android和Web界面,从目前的研发水平来看,该算法的准确率达到了77%。该公司发表的一篇研究论文,解释了这个叫做Pix2Code的模型是如何工作的。
跟所有机器学习一样,研究者们需要用手头的任务实例去训练模型。但与其他任务不同的是,它需要做的不是从图片中生成图片,也不是把文本转换成文本,这个算法要做到输入图片后生成对应的文本(在这里就是代码)输出。为了实现这一点,研究者们需要分三个步骤来训练,首先,通过计算机视觉来理解GUI图像和里面的元素(按钮、条框等)。接下来模型需要理解计算机代码,并且能生成在句法上和语义上都正确的样本。最后的挑战是把之前的两步联系起来,需要它用推测场景来生成描述文本。
在另一方面,它也能让复制其他网站的代码变得更容易,这是一个已经让困扰了很多开发者的问题。虽然像在Github这样的网站上,程序员之间已经流行起了协作共享的精神,但有些开发者—尤其是那些为需要原始网站的客户开发网站的—他们并不想让其他人剽窃自己的代码。
在实际工作中,Pix2Cod肯定能为开发者节省时间,他们就能把设计好界面的JPEG图像输入Pix2Code,生成可运行的代码,并且还能进一步调整和优化。而那些只有基本代码知识的UI或平面设计师,有了它的帮助就能自己构建起整个网站了。UIzard Technologies还在继续优化改模型,用更多的数据训练它以提升准确度。公司创始人兼CEOTonyBeltramelli最近完成了他在哥本哈根信息技术大学(ITUniversityofCopenhagen)和苏黎世联邦理工学院(ETHZurich)的机器学习毕业项目,也有将Pix2Code贡献給学校的考虑。
我们的模型能够从单一输入图像中生成针对三种不同平台(即iOS、Android和基于Web的技术)的代码,其准确率超过77%。本文的第一个贡献是pix2code,一个基于卷积和循环神经网络的新方法,它能够由单个GUI屏幕截图生成计算机代码。本文的第二个贡献是发布来自三个不同平台的GUI屏幕截图和相关源代码组成的合成数据集。在本文发表后,此数据集将开源免费使用,以促进今后的研究。
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16