【本文来自钛媒体特色栏目「快公司」】
近日,程序代码库分析平台思码逸宣布于去年9月完成520万美元A轮融资,本轮融资由经纬中国领投,GGV、联想之星、Polychain等既有投资者跟投,资金将用于技术投入与产品迭代。
据公开资料显示,思码逸由清华大学计算机科学与技术博士任晶磊于2018年创立,同年3月获Polychain Capital 和 OSS Capital 110 万美元天使轮投资;2020年5月获得由GGV领投、联想之星和Polychain 跟投的410万美元Pre-A轮融资;9月再获得经纬中国领投520万美元A轮融资。
成立不到4年连续获得3轮融资,思码逸对投资人究竟有何吸引力?钛媒体借由本次融资,专访了思码逸创始人任晶磊。
一篇论文开启创业之旅
“在国际级软件工程会议FSE发表论文《Towards Quantifying the Development Value of Code Contributions》是思码逸项目研发的基本框架和最基础的技术,也是产品到解决方案的一个支撑,就像当年谷歌的两个创始人发表Page Rank一样,从那篇论文开始,一直打造出如今的谷歌搜索引擎以及整个商业帝国。”任晶磊向钛媒体讲述道。
任晶磊2016年从清华计算机博士毕业后,在斯坦福大学、卡内基梅隆大学担任访问学者从事关于软件系统的研究,同时也为开源社区贡献代码,之后加入微软研究院工作。
在微软研究院工作期间,他了解到Facebook采用统计代码行数的简单粗暴方式来决定奖金,这让他意识到企业对于量化程序员的工作是有需求的。但是这种方式并不适用于所有团队,他开始思考,既然做程序分析,能不能通过一些更智能和深度分析的方式来测量程序员的工作。
同时,还有一个问题一直在困扰着他,多年来他们一直在社区贡献开源代码。现在很多开源项目已收到一些捐款,如何合理分配这些捐款一直是他在思考的问题。如何让程序员的智力成果获得长期的收益,从而促进整个开源社区的繁荣,特别是今天有92%的应用都依赖于开源软件。
基于以上两个因素,任晶磊决定为量化程序员工作、开源社区做些什么。于是,2018年底他与殷和政、Roland一起创建了思码逸,主营业务就是通过深度代码分析技术,主要包括程序分析和人工智能,来量化程序员的工作。
新场景、新数据、新架构
根据Evans Data Group 2019年报告,全球开发者规模达2390万,预计5年内将增长至2870万。同时随着人力成本的不断攀升,开发者的成本又居于前列,研发团队由粗放增长转型精细化管理、效能提升的需求越发迫切。
思码逸2019年初上线的企业版产品,是在深度代码分析技术与机器学习技术的基础上,从历史及当前代码库中提取回溯数据、实时分析并反馈,为企业提供软件工程管理与人才发展解决方案,以更智能的度量驱动管理升级,推动开发团队与开发者个人共同提升。
目前市面上广泛使用的工作时长、代码行数(LOCs,Line of Codes)、提交次数(NOCs,Number of Commits)等指标较为“简单粗暴”,很容易被换行、死代码等噪音所干扰。
而思码逸的代码分析引擎是将代码编译为抽象语法树,辨别每一次提交所产生的代码逻辑量变化,从而进行工作量的判断;此外,分析引擎也能够从代码间调用关系中分析出函数影响力,再结合代码质量以及代码对项目整体质量的影响,能够较为准确、客观反映开发者的工作价值。目前该分析引擎已支持15种开发语言,且正在持续补充中。
产品上线以来,已服务了腾讯、滴滴出行、和讯网、工银瑞信、长亭科技、知道创宇、百融云创、票易通、开思汽配、微鲤科技等多行业客户,这也侧面反映出企业对研发效能提升的迫切需求。
任晶磊表示,针对不同行业客户的需求,产品不断升级至3.0,将从新场景、新数据、新架构三个维度对产品进行全面优化。
新场景
高管、技术负责人、项目经理、开发者角色,不同角色所需的效能数据侧重点与颗粒度有多不同,思码逸针对不对角色、使用场景出发,重构了产品内的信息框架。
具体而言,高管能够快速纵览不同团队或项目的研发效能状态与趋势,基于行业效能参考基线,精准指导团队提升方向;项目经理则能够实时把握具体迭代进度,回顾项目效率、质量与稳定性,快速发现并响应瓶颈;技术经理能则够持续追踪技术债堆积,在软件开发周期的各个阶段识别风险,精细洞察每位开发者的产出效率与质量,及时激励优秀成员;开发者能够借助量化的研发效能,直观地展示自己的贡献,快速识别自己的代码可优化空间,以及如何优化,从而自发提升工程质量,提高软件制品的可维护性。
新数据
在既有的代码分析数据基础上,接入了JIRA的研发流程管理数据,一方面让研发效能数据汇于一处,方便管理者从多个视角了解研发流程及成果;另一方面,这些指标能够与既有效率和质量指标交叉分析,产生更加深入的洞见,帮助管理者及时感知研发动向。
同时, 3.0版本补充了基于开源项目的行业效能数据。根据企业项目的规模及语言,思码逸系统能自动匹配近似的优秀开源项目,提供外部基线参考,帮助研发管理者快速定位自身团队在行业中所处的水平,客观认知提升方向。
新架构
任晶磊表示,在服务滴滴、腾讯、泰康人寿等大型企业的时候90%采用的是私有化部署形式,发现企业不仅组织结构复杂,项目层级繁多,且代码量巨大,可能有上万个代码库、几十TB代码,规模超过早期产品版本可支持的范围。
为了解决这一问题,在发布3.0版本中,思码逸够支持复杂组织与项目结构,快速导入与配置,提升了客户的启动速度,优化了使用体验;同时,底层的分析引擎也进行了技术重构,基于K8s的分布式计算能力,目前已能支持万级代码库的导入与分析,满足大型研发团队的需要。
深耕代码分析市场,引入AI专家系统
任晶磊表示,“未来将会在两方面加大投入,一方面继续深耕代码分析市场;另一方面引入AI专家系统协助企业更好解读分析出的数据。”
具体而言,深耕代码分析市场方面,将继续打通研发流程中的前后环节,接入更广泛的研发数据,如漏洞缺陷数据、性能测试、日志分析等,将不同数据交叉分析,使研发过程及成果整体可追溯,为研发管理提供更完整深入的洞见,带来新的商业价值。
引入AI专家系统方面,将现有的轻咨询服务进一步产品化,提升系统解读数据、发现问题、判断趋势的能力,使数据分析能够更直接地助力研发管理决策。
对于企业盈利方面,任晶磊的思考是,目前以企业版产品私有化部署为主,订阅方式收费,因为截止2021年前4个月已实现了去年全年销售额的150%,到期客户全部留存的业绩。同时也预计今年将上线公有云服务,为中小企业客户提供更加便捷高效的部署与使用体验。
此外,还在2020年底发布了开源社区版本Merico Build,免费为开源项目提供效能和社区活跃度分析,为开源贡献者提供个人贡献报告。
希望通过公有云服务与社区版产品的推动,持续沉淀研发效能数据、优化底层计算引擎,打造具有公信力的深度代码分析引擎,成为开发者及开发团队贡献分析、效能分析、胜任力分析等方面的行业标准。
(本文首发钛媒体App,作者 | 郭虹妘,编辑 | 蔡鹏程)
根据《网络安全法》实名制要求,请绑定手机号后发表评论