写电邮的小习惯暴露了你的身份
credit: 123RF

诺丁汉特伦特大学的一项研究表明,最少仅需两个词就可以识别出一封电子邮件的作者。

David Wright博士是一位法学语言专家,他检查了数千封电子邮件,以通过分析有细微差别的单词序列来识别该封邮件的作者。专家在法庭诉讼或报告中分析语言证据时,难免会遇到挑战,而此项研究的目的正在此。

计算机专家会使用算法和统计分析等方法来衡量文本之间的相似性。然而,专家们很难解释为什么这些技术能仅凭细微差别就把人区别开来。

作为这项研究的一部分,Wright博士分析了一家能源公司的12名员工的数千封电子邮件,并在电子邮件样本长度超过1000字的情况下,准确地确定了95%邮件的作者。至于方法,他是通过比较员工在电子邮件中使用特定的单词序列的频率来判定的。

这些单词序列从两个词到六个词之间不等,并且也是常用语句,比如:“请审查然后与我商讨”这样的话。

这项研究基于美国安然公司发出的数千封电子邮件。超过170万封电子邮件已公之于众,此后一直被用于相关研究。通过分析这些电子邮件,博士还发现,人们加入一些短小词汇的方式都是独一无二的,因为他们会受到不同写作风格的影响。
写电邮的小习惯暴露了你的身份
credit: 123RF

Wright博士仔细研究其中一位雇员的案例,他是该公司的一名律师。
他将这位律师与其他175员工进行比较,并发现了最能表明邮件出自他手的话:“请审查然后与我商讨”。

虽然公司的其他律师也会以“请审查”开头,但都与这位律师的习惯有所不同。这表明每个人在表达相同的意思时,词汇选取与组合方式都有所不同。

艺术人文学院的Wright博士说,这些词语的重复性表明,随着积累的过程每个人都有了自己独特的表达方式,这样别人也就能知道是谁完成了工作。

“这表明,当面对书面证据的情况下,虽然可能难以一下子辨别作者究竟是谁,但分析那些日常用语细微的差别我们就能有所发现。这可能会提高相关物证的可靠性,并最终实现司法公正。”

本文译自 phys,由 Imagine 编辑发布。

[ 广告 ]
赞一个 (4)

PREV :
NEXT :