初创公司UIzard Technologies开发神经网络可将GUI截图转换成代码行

新知榜官方账号

2023-10-03 18:02:28

初创公司UIzard Technologies开发神经网络可将GUI截图转换成代码行

UIzard Technologies是一家初创公司,训练了一个神经网络能将图形用户界面的截图转译成代码行,成功为开发者们分担了部分网站设计流程。令人惊叹的是,同一个模型能跨平台工作,包括iOS、Android和Web界面,从目前的研发水平来看,该算法的准确率达到了77%。该公司发表的一篇研究论文,解释了这个叫做Pix2Code的模型是如何工作的。

跟所有机器学习一样,研究者们需要用手头的任务实例去训练模型。但与其他任务不同的是,它需要做的不是从图片中生成图片,也不是把文本转换成文本,这个算法要做到输入图片后生成对应的文本(在这里就是代码)输出。为了实现这一点,研究者们需要分三个步骤来训练,首先,通过计算机视觉来理解GUI图像和里面的元素(按钮、条框等)。接下来模型需要理解计算机代码,并且能生成在句法上和语义上都正确的样本。最后的挑战是把之前的两步联系起来,需要它用推测场景来生成描述文本。

在另一方面,它也能让复制其他网站的代码变得更容易,这是一个已经让困扰了很多开发者的问题。虽然像在Github这样的网站上,程序员之间已经流行起了协作共享的精神,但有些开发者—尤其是那些为需要原始网站的客户开发网站的—他们并不想让其他人剽窃自己的代码。

在实际工作中,Pix2Cod肯定能为开发者节省时间,他们就能把设计好界面的JPEG图像输入Pix2Code,生成可运行的代码,并且还能进一步调整和优化。而那些只有基本代码知识的UI或平面设计师,有了它的帮助就能自己构建起整个网站了。UIzard Technologies还在继续优化改模型,用更多的数据训练它以提升准确度。公司创始人兼CEOTonyBeltramelli最近完成了他在哥本哈根信息技术大学(ITUniversityofCopenhagen)和苏黎世联邦理工学院(ETHZurich)的机器学习毕业项目,也有将Pix2Code贡献給学校的考虑。

我们的模型能够从单一输入图像中生成针对三种不同平台(即iOS、Android和基于Web的技术)的代码,其准确率超过77%。本文的第一个贡献是pix2code,一个基于卷积和循环神经网络的新方法,它能够由单个GUI屏幕截图生成计算机代码。本文的第二个贡献是发布来自三个不同平台的GUI屏幕截图和相关源代码组成的合成数据集。在本文发表后,此数据集将开源免费使用,以促进今后的研究。

本页网址:https://www.xinzhibang.net/article_detail-15197.html

寻求报道,请 点击这里 微信扫码咨询

关键词

UIzard Technologies Pix2Code 神经网络 GUI截图 代码行

分享至微信: 微信扫码阅读

相关工具

相关文章