2019年01月25日

PDFの表をExcel化する方法

本日は飲み会のダブルヘッダー。当初予定していた飲み会は楽しい食事会だったのだが、その後、結構濃いメンバーからのお誘いを食らってしまった。1次会は肉会で、肉好きの集まり、せっかく予約してもらった人気のお店をまたリスケして最予約してもらうのは申しわけない。しかも先約なので最優先で対応だ。その後かぶせられた2次会から参加の飲み会は、もともとかつての上長を囲んだ、横浜方面の飲み会。横浜方面の飲みは2つあって、今回は、久々のメンバーの方。まぁ、今回人事で喜ばしいこともあったのでということで企画してくれたようだ。とはいえ、こちらのメンバーは飲むと制限がないので1次会から参加すると大変なことになりかねない。2次会以降からということでちょうど良かったかもしれない。 さて、仕事で見つけたTIPSの話。監査対応ということで、とあるExcelファイルに記載のある内容とPDFファイルにある内容の突合というのがある。さらに、現物確認でキングファイルから見つけるということも。後者の現物確認はやはり自動化は難しそうだが、前者ぐらいはなんとかできるのではなかろうかと。ただ問題があった、Excelファイルから検索した項目をPDFから検索するのだが、PDFのできがあまりよろしくなく、へんな場所に改行がはいるため、見つけられないという事象が発生した。そもそもPDFは編集ができないので作業に向かない。というわけで、PDFをExcelに変換かけたいのだが、これがなかなかうまく行かない。そこでネットで調べてみると、どうやらWordをかませるといいということが分かった。WordでPDFファイルを開くと表形式がきちんと保存されている。それをExcelにコピーするときちんとした表になるというもの。おぉ、これは目から鱗でした。あとはExcel内で数値を拾って、もう一枚別のシートから検索するってところまで自動化できれば一気通関となるのでしょうか。これぞRPAのみせどころでしょうか。 そうそう、昨日のブログで記載した内容に誤りが。95%に収まるのは3σ(σは標準偏差のこと)ではなく2σでした。しかも前提があって、分布が正規分布(母数が1000以上ある場合はたいていあてはまるらしい)に基づく場合という前提はあるようだ。ちなみに1σだと68%とのこと。なので、平均±σには68%のものが収まり、平均±2σには95%が収まるとのこと。ちなみに学力の偏差値はσを10にした場合の分布だそうで偏差値60だと上位16%以内に入っていて、偏差値70だと上位2.5%以内に入っているということらしいです。偏差値70だと100人中3位以内ってことですね。ほぅ、統計学って知るとおもしろいです。

taka7107 at 07:41│Comments(0) TIPS(技あり!) 

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔   
 
 
 
プロフィール
TAKA
「あたらしいもの」「便利なもの」「お得なもの」「かわいいもの(hina)」が大好き。藤沢市在住。妻(yuki)一人、娘(hina)一人。かなり運動不足。。。でもBMIは22。(最近ちょっと太ったの)
コロプラ
livedoor 天気
クリックしてね
「Amazonライブリンク」は提供を終了しました。
「Amazonライブリンク」は提供を終了しました。
「Amazonライブリンク」は提供を終了しました。
「Amazonライブリンク」は提供を終了しました。
「Amazonライブリンク」は提供を終了しました。
QRコード
QRコード
ここから買ってね(楽天)
あわせて読みたい