データ・サイエンティストは可視化の夢を見るか?

Does Data Scientist Dream of Visualization?

プログラミング教育に思うこと

今日和。 昨夜は「いつもの店」に出かけると、そこに大学の人熊先輩が同期を連れてやってきました。 話題の一つが「プログラミング教育」。 先輩もわたしも大学在籍時は、コンピューター演習のヘルパーをやって同期や後輩を教えるぐらいにはプログラミングに…

血肉となっていない

今晩和。 ひさしぶりに自分が練習したりコーディングした Mathematica や MATLAB のソースコードを読み直しはじめました。 ……が、ちんぷんかんぷん。(滅)いや、分かりますよ、ほんとうは。(汗) でも、ちゃんと覚えて身になっているかといえば、そうでは…

ドキュメント編集履歴の一元管理を試みたが

今日和。 ちょっと脇道に逸れている数日です。 結構、長文のドキュメントを打ち込む必要が出てきまして、二三日苦労して一元管理できる環境を構築していました。御存知の人は御存知の Gollum というローカル Wiki システムです。これは Git と統合されている…

猪突猛進では埒が明かない

今日和。 『競プロ』に挑戦するにあたって、無手勝流で猪突猛進しても正面突破に時間がかかって敗北するだけ。 という次第で、指南書に手を出しています。 でも率直にいって、なかなか歯が立っていない感じがしていて、致し方なく『写経』から入っています。…

本質的なこととは

Johns Hopkins の MOOCs “Executive Data Science” を修了しての感想で、ネタばれをちょっとだけ。統計分析もそのほとんどはチーム作業になり、チーム内外とのコミュニケーション、リーダーシップ、そして逐次の報連相が重要なのは変わりがありません。わた…

人生到る処青山あり

今日和。 ちょっと鬱です。 我ながら本を買いすぎで。 読めもしないのに。でもパラパラと、ちょっとめくると中々興味深い図版が列挙されていたり。 こういうの、地道にアニメ化するだけで随分と面白いことになりそうなんですが、どうもイタリア人数学教授と…

啓蒙書に畏れいる

今日和。 ちょこちょこと数学・物理の勉強を続けています。 放送大学の通信指導課題はなんとか提出しました。そこそこの点が取れるものもあれば、ケアレス・ミスで惨憺たる結果も。 それに、いくら放送大学の難易度設定がやさしめになっているからといって、…

反省タイム

粗忽者として『競プロ』に片足を突っ込んでみての反省。 問題をよく把握してもいないのに走り出してしまう 事前に「絵図面」を描かない 〆切を口実に五月雨式作業を続けてしまう デバッガーの使い方が下手 逆問題で解けることが多いことを意識できていない …

さらに恥を晒す

今日和。 また『競プロ』に時間を費やしています。 ですがケアレス・ミスで惜しいところで大量失点してしまいました。 ただ今回の問題(特定を避けるため敢えて秘します)で学んだのは 逆順で考える 簡単なルール・ベースの手順に落とし込む 逆引きインデッ…

恥を晒す

今日和。 弱い四十を超えたこの歳をして『競プロ』なるものに熱中しはじめました。 「競技プログラミング」のことです。 ですが、スゴく成績が悪い。 恥ずかしいことです。 まあ私の場合、専業の SE+PG のキャリアは少ないので、自ずとスキルが限られている…

見通しが立つ

今晩和。今期、放送大学の学部に入り直して 4 コマ 8 単位(こういう言い方で正しかった?)を受講しています。 そのそれぞれについて通信指導課題の提出〆切が月末に迫っています。 きょう、そのすべてについて回答の見通しが立ちました。 『入門線型代数』…

発想力の差 —— 学問のススメ ——

昨日は Code for Japan Summit 2016 の『前夜祭』にも参加してきました。 そこで各プロジェクトの紹介がありましたが、出色の出来のものがひとつありました。 詳しいことは勝手にネタバレしても申し訳ないので特に秘しますが、物理数学を社会問題の分析にア…

打ってつけのツール

データ可視化において直感的に試行錯誤するのに打ってつけのアプリを見つけました。 “Tableau Desktop” です。期間限定の試用版があります。www.tableau.com この試用版に同梱の、世界銀行のデータを使って、「国別の労働力人口にたいして一人当たり GDP が…

Ruby スクレイピングのために MeCab をインストールしてみる(備忘録)

今日和。 こちらも私的備忘録です。 形態素解析で有名な MeCab (和布蕪)をインストールしようとして、ネットを検索して四苦八苦していたのですが、以下のページが(現時点では)一番良くまとまってました。statsbeginner.hatenablog.comとりあえず、おかげ…

Ruby スクレイピングのために nokogiri をインストールしてみる(備忘録)

今日和。さて、Ruby でスクレイピングするにあたって必要な機能を brew や bundler でインストールしています。 今回は nokogiri について。 ネットを検索してあれこれ試行錯誤しないと上手く行かなかったのですが、わたしの環境(macOS Sierra)で上手く行…

Ruby によるクローラーを動かしてみたい

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例作者: 佐々木拓郎,るびきち出版社/メーカー: SBクリエイティブ発売日: 2014/08/22メディア: 単行本この商品を含むブログ (10件) を見るデータ・サイエンスに慣れていくためには、研究用のデー…

Got it!

やりました! Johns Hopkins の MOOCs、最後のコース “Executive Data Science Capstone” に合格しました!!事前にできるだけがんばって予習していったんですが、予想より簡単ではありました。というより懇切丁寧、というべきでしょうか。 「実地試験」と予…

実地試験を前に

今日和。 Johns Hopkins の MOOCs 最終コース “Executive Data Science Capstone” を受講しようと思って、立ち止まってます。 とある外部サイトなどの御協力で「実地試験」形式なのです。 採点も減点法で油断できません。 一度、これまでの 4 コースを復習し…

温故知新

今日和。 放送大学で数学史のコマを勉強してます。いやあ、利瑪竇(り・まとう)の名前が出てくるとは思いませんでしたよ、ユークリッド『原論』の話で。 利瑪竇とはマテオ・リッチのことです。16 世紀に中国宣教に赴いて明王朝に多大なる貢献をしたイエズス…

鈍ってしまった腕

放送大学の『入門微分積分』のコマを大急ぎで学習しています。 今月末までに履修各コマの通信指導課題を提出しなければならないのですが、私事なども鑑みるに早めの対処をしておかないとマズいからです。それにしても腕が落ちてます。 高校時代はこれでも数…

人工知能の軽妙なセミナーに参加してきました

今日和。 先日の話です。 『よくわかる人工知能 特別講義 〜深層学習の現状とこれから〜』というセミナーに参加してきました。 ええ、御存知の方は御存知の、株式会社 UEI 清水 亮氏の新著公刊を受けてのセミナーです。まあ、軽いタッチの内容で、「いま、こ…

データの可視化について

ちょっと前まで手伝っていた研究室で、海外からのお客人がいらっしゃいました。 カオス理論に詳しい科史科哲の先生で翻訳書もいくつか出版されています。 その本を読み始めて、なかなかイメージがつかめなかったので、いつものとおりアニメ化(MATLAB)して…

図解を綺麗にまとめてみる

今日和。 昨日、いろいろと試行錯誤していた図解を Illustrator で製図してみました。 要は連立方程式に於ける『クラメールの公式は面積比(行列式の比)』ということを解説したくて作図してみたんですが、これをアニメーションにしてみたりすると、さらに理…

自分でも絵解きをしてみる

今晩和。 小島先生の本にかぎらず「行列式は平行四辺形の面積(2 次元)や平行六面体の体積(3 次元)」という解説をしている本はあります。 ですが、それだけではどうにも納得がいかない。 そこで連立方程式の解の公式である『クラメールの公式』と行列式が…

絵解きのたいせつさ

御無沙汰してました。 エントリーを書かないでいた間もいちおう勉強はしてました。 放送大学『線形代数』の教科書にマーキングして。 でも、ちょっと理解が進まないんです。 ですが、同じ箇所のヴィデオ講義を視聴して分かりました。授業を受けたほうが分か…

あたらしい学習法の模索

放送大学で『線形代数』のコマを取って独習しています。 いまはテクストブックをひととおり読んで概観を掴もう、という段階。 自炊した PDF に GEMBA Note でマーキングしている最中です。これ、なにが良いかっていうと、途中で練習問題を解いたりするとき、…

復習は大事

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 4 コース “Data Science in Real Life” を修了しました。今回はスケジュール的には余裕がありましたね。 最終的にはそこそこの成績になってしまいましたが。 で…

快調だったのに落とし穴

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 4 コース “Data Science in Real Life” を受講中です。 小テストで満点を連続して取れていたのですが、終盤で引っ掛かってしまいました。このコースは『理想論…

達成感

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 3 コース “Managing Data Analysis” を修了しました。 今回は達成感が強いです。 自分にとってちょっと難しすぎるくらいのレッスンを、きっちりとこなしてきた…

濃密なレッスン

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 3 コース “Managing Data Analysis” を受講中です。 “Exploratory Data Analysis” というレッスンを受けたのですが、けっこう濃密でたいへん勉強になりました。…

分かりやすい教科書

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 3 コース “Managing Data Analysis” を受講中です。最初の Quizzes の挑戦に失敗したので、そのあいだに「購入(寄付)」させられた教科書を使って復習してみた…

急に難しくなる

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 3 コース “Managing Data Analysis” を受講中です。 でも、なんだか急に難しくなりました。 スライドによるまとめの表示もないし、読み込まなければならないテ…

鬼門

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 第 3 コース “Managing Data Analysis” の受講を始めました。 ところが不安が。 講師の Penn 先生が早口なんですね。 あと、言いまわしも native 寄りなのか分かり…

機械学習への一里塚

“Data Science from Scratch”、第 18 章 “Neural Network” まで写経が進みました。Data Science from Scratch作者: Joel Grus出版社/メーカー: Oreilly & Associates Inc発売日: 2015/04/30メディア: ペーパーバックこの商品を含むブログを見る同書でのニュ…

macOS Sierra にアップグレードしたら R が動かない

先日、macOS Sierra にアップグレードしました。 そして今朝、ひさしぶりに Jupyter Notebook を起動して R を使ってニューラル・ネットワークの勉強をしようと思ったら、R がコンソール上でクラッシュをくり返します。Homebrew を使ってインストールした R …

ひととおり眺める

ひきつづき放送大学『データの分析と知識発見('16)』を受講しています。 第 15 回までひととおり眺めました。学部の、初心者向けの授業として「例題をすこしやりながら概観を掴ませる」という観点では、よく練られたコースではなかったでしょうか。 特に終…

ざっくりと掴む

ひきつづき放送大学『データの分析と知識発見('16)』を受講しています。 第 10 回まで来ました。 主成分分析、多次元尺度法、因子分析と眺めて、成る程、要は多次元のデータを(可視化できるくらい)すくない次元に集約して評価できるようにするところが共…

隔靴掻痒

ひきつづき放送大学『データの分析と知識発見('16)』を受講しています。 空き時間を見つけては視聴して、第 8 回まで来ました。 正直、隔靴掻痒の感が強いですね。 学部生向けの基礎科目といった側面が強く出ていて、説明は通りいっぺんのモノに収まってい…

次のコースを通過

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 明日は第 2 コース “Build Data Science Team” の締切日です。 先程、これを修了することができました。コース難易度は第 1 コースに比べ、若干上がっています。 …

軽すぎるスタート

まだ後期にはなってないのですが放送大学『データの分析と知識発見('16)』の受講を始めました。 第3回まで消化したのですが、正直軽めのスタートですね。 そもそも学部生向けの科目ですから。 とりあえず通してみて様子を探ります。

放送大学でやり直す

また、放送大学のコマ(今度は学部から)をいくつか受講することに決めました。 今回は『データの分析と知識発見('16)』が含まれます。 R を使った統計分析の授業です。 とにかく、がんばります!

小休止

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 きょうは第 2 コース “Building a Data Science Team” 受講の申請をしました。 9 月 19 日からスタートです。 それまでのあいだに、他の書籍で学習を続けておきま…

駆け足の限界 ——ではペースを落として——

“Data Science from Scratch”、第 15 章 “Multiple Regression” 、第 16 章 “Logistic Regression” まで進みましたが、そろそろ駆け足で跳ばしてきた限界が出ています。Data Science from Scratch作者: Joel Grus出版社/メーカー: Oreilly & Associates Inc…

序盤戦

今日和。 Johns Hopkins University の MOOCs “Executive Data Science” を受講しています。 きょうは第 1 コース “A Crash Course in Data Science” の締切日です。 ところが最後の Quizzes (小テスト)の問題を何度も落としてしまって、再試験制限(8 時…

MOOCs の受講を始める ——鳥瞰図を得るために——

お待たせしました。MOOCs の世界でも秋学期が始まりました。 そこで Johns Hopkins University の “Executive Data Science” の受講を始めました(今日から始まっています)。 受講理由はガイダンスを読んでみたところ、データ・サイエンスについての鳥瞰図…

併読の効用 ——単回帰分析——

ひきつづき併読を続けています。現在地は第 14 章 “Simple Linear Regression”。Data Science from Scratch作者: Joel Grus出版社/メーカー: Oreilly & Associates Inc発売日: 2015/04/30メディア: ペーパーバックこの商品を含むブログを見るさくさくとコー…

ひきつづき併読してみる —— k 最近傍法——

前掲書を読み進めています。第 12 章 “k-Nearest Neighbours” (k 最近傍法)です。Data Science from Scratch作者: Joel Grus出版社/メーカー: Oreilly & Associates Inc発売日: 2015/04/30メディア: ペーパーバックこの商品を含むブログを見る 先ず、概説…

併読してみる ——主成分分析——

前掲書を読み進めています。Data Science from Scratch: First Principles with Python作者: Joel Grus出版社/メーカー: O'Reilly Media発売日: 2015/04/14メディア: Kindle版この商品を含むブログを見る 『主成分分析』の章まで読みました。主要なコードを…

いちから実装してみる

今夜はあまり眠れなかったので調べ物をしてみたのです。 此の界隈の有名人(?)TJO 氏のブログで、O'reily の『集合知プログラミング』という古い本を見掛けました。解説によると、いちからスクラッチしてアルゴリズムを実装するとのこと、ものすごく興味を…

翻訳書が出ていました

以前、ちょこっと紹介した Packt Publishing の “Python Machine Learning” に翻訳書が出ていることに気付きました。 Python Machine Learning: Unlock Deeper Insights into Machine Learning With This Vital Guide to Cutting-edge Predictive Analytics …