2021年9月23日 (木曜日)

11:57:47 # Life timesyncd設定してからしばらく放置していたシステム。以前は200msくらいずれていたのに今みたら数ミリ秒くらいしかずれてないっぽい。よい。

18:01:03 # Life colab, pandasでサンプリングのデータを処理してみた。 コロナウィルスの蔓延度を計測する一つの方法として適当に市中の人に検査に協力してもらうというモニタリング検査というのがあって そのモニタリング検査の結果がCSVで提供のでそれを処理してみた。 機械処理するという点ではCSVファイルでおいてあるのはまずよい。 まず文字列のエンコーディングがShift-JISであることでなんか嫌な予感、きょうびUTF-8が標準的。久々に文字コードなんてものがあるのを思い出させられた。 週数が文字列で1週目とかになっているのでなんかさらに嫌な予感。 そして検査数 にスペースが入っているコラム名になっているので更に嫌な予感。 あと数字がコンマ区切りになっているのでもっと嫌な予感。 ではあるがまぁ一応処理できなくもないCSV。

memo

region = pandas.read_csv('https://corona.go.jp/monitoring/csv/region_result_20210916.csv', encoding='shift_jis')
tokyo_sample = region[region['都道府県']=='東京都']
tokyo_sample['week'] = pandas.to_numeric(tokyo_sample['モニタリング検査実施週'].str[:-2])
tokyo_sample['positive_rate'] = tokyo_sample['陽性疑い者数'] / pandas.to_numeric(tokyo_sample['検査数 '].str.replace(',',''))
	
Junichi Uekawa