统计学家拯救了APP开发人员?
majer @ 2018.11.20 , 09:00 上午移动端应用程序的开发人员可说是艰难度日。
每次写好更新后,他们都需要看看用户的反馈以及竞争对手的更新情况。
结果打开评论之后:
-
“你的才短!”打分☆
“翻页那里去了????”打分★
“太卡,那谁出来女装道歉!”打分★☆
……
APP开发人员必须根据用户评论,立即做出适时的调整。
但仅仅基于数千条简短的在线评论,想要挖掘出用户不满意的真正原因,那需要密集型的劳动,耗时且昂贵。代价很高。给用户带来糟糕体验的APP可能会损害企业的形象,把客户驱赶到竞争对手那里。
康奈尔大学的统计学家和他的同事发明了一种便捷的手段来帮助开发人员改进自己的APP。他们借助最新的文本挖掘方法,只需一步即可聚合和解析用户评论。
“我们的想法是,设计一种能够查看所有评分的方法,并能一针见血地找出人们不满意之处,那些可能是开发人员应该关注的重点。”塞缪尔·柯蒂斯·约翰逊大学研究生院、信息管理系的助理教授Shawn Mankad说。
他们的思想可能会为移动商务带来重大的影响,而预计到2020年,移动商务的规模将达到2500亿美元。据Mankad及其同事称,随着智能手机的普及,移动商务已经开始显著地影响到了所有形式的经济活动。
Mankad是《一步预测与移动应用程序管理在线评论的嵌入式主题建模》Single Stage Prediction with Embedded Topic Modeling of Online Reviews for Mobile App Management的主要作者,该文章被收录在即将出版的“应用统计年鉴”中。 Mankad的合着者是康奈尔大学博士候选人Shengli Hu和马里兰大学的Anandasivam Gopal。
Mankad从美国国家科学基金会获得的52.5万美元拨款。最初的目标是开发出新的统计工具来监测金融体系的稳定性。
在最新的研究中,Mankad和他的同事将这些工具应用于解决移动应用程序开发的问题。
在文本挖掘技术中,表示文本的常用方法是构建一个巨大的矩阵来跟踪哪些单词出现在哪条评论中。“这个矩阵太宽了,有那么多的列,你需要以某种方式精简它。”Mankad说,“这就是我们的方法发挥作用的地方。”
实际上,该模型赋予评论中出现的单词一个加权平均值。每个加权平均值代表一个讨论主题。用模型得到的结果,不仅可以为单个应用程序的性能优化提供指导意见,还可以比较同类型APP的基准性能和消费者情绪。
“你给我文本和打分,我给你输出一张一目了然的意见表格。”Mankad说。
他们使用模拟数据和来自美国三家最受欢迎的在线旅行社——Expedia,Kayak和TripAdvisor——APP下的超过104000条评论测试了模型。所有APP应有共经历了162代版本更迭,每个APP每年有超过1000条评论。
Mankad和他的同事发现他们的文本挖掘模型在预测真实评论和模拟数据的准确性方面比标准方法表现得更好。他们发现该方法可以帮助公司权衡他们发布新版本应用程序的频率。
“在文本挖掘领域中,有一种基于贝叶斯建模的方法超级流行。我的同行可能已经出现了技术教条主义的倾向。”Mankad说。 “然而,我们尝试利用矩阵分解方法做了一些不同的事情。要我说的话,如果你发现新方法在某些情况下可能更有优势,那最好还是应有新的方法。”
PREV : 日本的10个真相
NEXT : 辅助生殖技术似乎提高了儿童智力发育障碍的风险