Enron Dataset Research: E-mail Relevance Classification

VanBuren, Victoria; Villarreal, David; McMillen, Thomas A.; Minnicks, Andrew L.

Enron Dataset Research: E-mail Relevance Classification

Files

fulltext.pdf (142.1 KB)

Date

2009-09-25

Authors

VanBuren, Victoria

Villarreal, David

McMillen, Thomas A.

Minnicks, Andrew L.

Abstract

This paper discusses a probabilistic approach to address the problem of searching through large amount of data to find case-relevant documents. Using a valuable collection of data, e-mail communications from Enron, an actual corporation, we train a Bayes-based text classifier algorithm to identify e-mails known to be case-relevant and those known to be case-irrelevant.

Keywords

enron dataset, e-mail Relevance, e-mail classification, Bayes classifier, electronic discovery, forensics, Computer Science

Citation

VanBuren, V., Villarreal, D., McMillen, T. A., & Minnick, A. L. (2009). Enron dataset research: E-mail relevance classification (Report No. TXSTATE-CS-TR-2009-12). Texas State University-San Marcos, Department of Computer Science.

URI

https://hdl.handle.net/10877/2583

Collections

College of Science and Engineering

Full item page

Enron Dataset Research: E-mail Relevance Classification

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

Rights

Rights Holder

Rights License

Rights URI

URI

Collections