ある日のリプちゃんにとどいたメールのデータを準備しました。
データには、メールが届いた時間、件名、本文、迷惑メールかどうかという列がありそれぞれ次のような値が入っています。
時間(int):メールが届いた時間(1時間単位)
件名(str):メールの件名
本文(str):メールの本文
迷惑メールかどうか(int):1が迷惑メール、0が迷惑メールでない(リプちゃんが判断)
今回は、迷惑メールにどういった特徴があるのかを調べようと思います。
今回の調査では、ある単語が件名に含まれるメールの内、迷惑メールであるものがどれくらいあるのかを調べたいと思います。
それでは、単語がwordで与えられるので、wordを件名に含む迷惑メールがどの程度あるか、百分率で表示してください。ただし、件名にwordを含むメールが存在しないときは、
「件名にwordが入っているメールはありません」※wordの部分はあたえられた単語を表示
と表示してください。
表示をする時は例に示すように小数点以下切り捨てで表示してください。
word = "無料" # 調べる単語
85
切り捨てをする前の値は
85.714...
です。
# ファイルの場所: assets/mail_data.csv
import pandas as pd
data = pd.read_csv("assets/mail_data.csv")