Categories
Interviews

采访:《Lexikat》如何让 NLP 分析更快,更精准。

了解《Lexikat》如何让分析员处理大量的文本数据,减少花费大量的时间和精力。

今天,我们请到《Lexikat》中的Jennifer (邓梓超), Pei Junjie (裴俊杰), 和Zhang Shaorong (张邵蓉)。《Lexikat》成立于2019年,由李光耀公共政策学院(Lee Kuan-Yew School of Public Policy)的一批研究人员创办,是新加坡国立大学(National University of Singapore)备受赞誉的研究生研究创新计划(Graduate Research Innovation Programme 简称`GRIP`)的一个分支。

今天,他们将推出他们的第一个产品,这将使研究人员和分析人员可以将花费在分析和数据处理上的时间减少65%以上。

热烈欢迎Lexikat。

1. 首先,我要问一个比较明显的问题。请跟我们分享你们如何想出《 Lexikat》想法背后的故事

Jennifer: 那时,我在新加坡国立大学博士期间的研究方向是公共政策,需要处理大量的文本数据,花费很多的时间和精力。而市场上已有的软件,使用体验都不太好,要么结果不令人满意,要么使用特别难。因此,想到研发一个工具,让文本分析变得简单易得,同时靠谱准确,Lexikat的想法雏形形成。

Junjie:我本身在金融行业做过几年。每天处理大量的上市公司财报和公告数据,新加坡国立大学 (NUS)担任研究助理期间,也需要处理大量的文本,因此对分析算法有很深入的理解。 Jennifer: 刚好,在新加坡国立大学(NUS)对创业者的鼓励,我和Junjie创立了Vox Dei公司。我们的主力产品Lexikat也由此产生,让简单高效的文本数据分析由想法成为现实。在测试版本上线后,我们在不断优化算法和前后端,Lexikat在持续地完善,我们很期待正式版可以尽快投入市场,让更多有需要的人使用Lexikat。

2.对于我们大多数在美国和中国投资的人,不难相信有大量数据需要处理。 当您还在NUS GRIP计划时,一定会了解您的竞争对手的情况及其独特的卖点。 您当时收集了什么见解(Lexikat提供了比竞争对手更大的优势)? GRIP之后有什么变化?

Jennifer: NUS GRIP计划要求创业项目有独创性和市场价值,为了保证我们的项目有市场潜力,我们做了大量的研究工作。一方面我们使用市场上已有的软件,主要分为两种,QDA(定型数据分析)和NLP(自然语言处理),这两种软件各有优势,但也各有不足。使用QDA处理数据,可以自己设定一些条件,但是处理速度很慢,而NLP虽然速度比较快,但使用不友好,不仅需要使用者有一定的编程基础,还无法自定义自己的需求。Lexikat的优势在于兼顾了两者的优点,不仅操作方便,还可以自定义分析的需求,更重要的是处理速度快,而且结果准确,弥补了目前市场的空缺。因此我们的项目顺利通过了GRIP计划。

加入GRIP最直接的收获应该是现金流,GRIP给了我们的起步资金,为我们组建团队、开发产品和市场推广提供了基础。不仅如此,GRIP还给了我们很多对话潜在投资者/客户的机会,并给我们一些指导。更重要的影响是,NUS GRIP为我们提供了很宝贵的信誉背书,如果我们只是独立的小型创业公司,很难得到市场的信任,然而作为一个NUS支持的创业公司,我们就很自然地在市场上有了信誉,这一点对于创业公司非常重要和难得。

3. 很多时候,一个企业要成功也需要配合天时地利人和。在这方面,你们能和大家分享为什么现在是最好启动这个项目的时机吗?

Shaorong: 文本分析市场的需求一直存在,而且在变得越来越重要,但是目前市场上的解决方案,并没有特别令人满意的软件。因此Lexikat本身就有很大的市场价值,因此我们得到了NUS GRIP和私人投资者的认可,并有信心可以得到市场的认可。

根据市场调研的数据,目前全球市场的自然语言处理软件需求超过60亿美元,每年的增长率超过20%,特别是我们旨在切入的细分市场:高校和市场调研/咨询行业,需求正在快速增长。我们支持英文,不仅可以覆盖绝大多数学术处理需求,而且可以对接世界上最重要的社交媒体平台(Twitter和Facebook等),同时我们还专门开发了中文算法和网站,因为中国有巨大的市场需求,Jennifer在中国工作和生活过,Junjie也来自于中国,我们在中国有一些资源,也相信我们的产品可以满足中国市场的需求。

因此我们在快速开发和完善我们的产品,并期待尽快开拓更大的市场。

4: 如您所知,SSII很高兴成为您在中国的合作伙伴。其实,我们最喜欢《Lexikat》的一点就是,你们正在建立一些简单易用的东西,使许多分析师和研究人员的工作更容易。不难想象,鉴于中国拥有大量的研究人员和分析师,你的业务在未来不仅可以在中国扩展,还可以在美国扩展。分享一下你对此的看法,即使这是一个适合莱克西卡特着手的事情?

Jennifer: 文本分析的市场很大,有IBM和微软这样的软件供应商,我们有自己的切入点。我们有很好的高校资源,而且Lexikat开发的初衷是帮助研究人员快速并且愉快地分析文本数据,因此我们最先切入的细分市场是高校和研究机构。事实上,很多专业人士已经使用过我们的测试版软件,给了我们很好的反馈和很多宝贵的建议。Lexikat已经得到来自13个国家超过65个专业人士的提前订阅,大部分来自高校和研究机构,他们将是Lexikat正式上线后的最初用户,我们有信心可以帮助他们解决实际问题,并得到越来越多的订阅。

不仅如此,Lexiktat也实际应用在了数个我们给来自新加坡政府和私人机构做的咨询项目中,帮助我们处理了很多数据。因此我们的软件在市场调研/咨询等行业也有广泛的应用场景。

Lexikat支持中文与英文,是为了服务世界上最大的使用群体。中国市场非常大,不仅高校数量很多,市场调研/咨询等行业也蓬勃发展,能够争取到中国客户对未来的发展非常重要。目前我们紧密的高校关系包括复旦大学和浙江大学等知名高校,我们已经有很多的交流。同时我们对我们的中文算法非常自豪,因为准确度非常高,我们有信心可以让中国客户满意。我们计划成立中国办公室来专门开拓和服务中国市场。 不仅如此,我们和多个国家的专业人士/投资者都有接触和交流,我们也有意愿和能力开发更多语言,日语算法已经在我们技术开发的日程表,我们希望可以争取更多的市场。

5: 请您跟我们分享你们的一些项目和他们对你本身有什么意义?

Jennifer: 我们的客户来自多个国家和行业,目前主要分为三类。

第一类是Lexikat的订阅客户,目前已经得到超过65个来自13国家的预订阅,包括新加坡国立大学、复旦大学、北京大学和多伦多大学等。第二类是需要定制化算法的客户,他们有自己的需求,我们为他们提供定制化的API。几个有意思的项目包括正在和麦当劳洽谈中的社交媒体数据处理,为一家电子货币交易商提供交易策略数据支持,以及李光耀公共政策学院的数据处理项目。第三类客户是咨询客户,我们用Lexikat处理项目中的数据,客户包括新加坡社区文化和青年部、新加坡电影协会、李光耀公共政策学院、伦敦国王学院、Adam Smith Center和Independent.sg等。

一个有意思的项目是和李光耀公共政策学院合作的《车,房和菜饭》(“Cars, Condos and Cai Png”),这个项目是关于新加坡人对社会阶层的想法。在这个项目中我们收集到很多问卷数据,处理后我们得到很多有趣的发现。文章发表后立刻引起新加坡社会的强烈反应,在联合早报,Today,e27等中英文媒体的报道引起广泛讨论。在这个项目中我们得到很多一手数据,并用Lexikat得到快速分析结果,项目报告不仅引起社会的兴趣,扩大了我们的知名度,更重要的是,给我们带来了新的客户。

6. 到目前为止,你们的创业之旅最令你们回味的是什么?

Jennifer:在创业过程中我们有很多有意思的经历,但令我回味的旅程可以说是就是现在。受疫情的影响,我们的融资以及产品推广都受到很大影响,如果说我们承受的压力从1-10的话,我们目前的处境绝对很难,然而很神奇的是,我比想象中感觉更好,大概是一种至暗时刻后亮光即将到来的感觉。

Junjie:我印象最深的是Lexikat第一次上线,既紧张又期待的心情,因为不知道会出现什么样的情况,担心有想不到的bug,甚至担心完全无法运行,实际上也状况百出,但还是运行起来,给了我们分析的结果。在这之后我们一次又一次地改进算法,解决各种技术问题,我希望Lexikat的算法和网站都让使用者感觉到满意。

7. 如何,联系你们?

我们即将推出 《Lexikat》新的产品。请前往 https://www.voxdei.io/mianfei 注册账号免费试用。

有兴趣了解更多详情用户,或合作伙伴也可以直接联系我们 (Lexikat):+65 91330611 或通过邮件[email protected]

https://Voxdei.io

https://Lexikat.com

当然,你们也可以通过 SSII 联系我们