$shibayu36->blog;

クラスター株式会社のソフトウェアエンジニアです。エンジニアリングや読書などについて書いています。

2017-01-01から1年間の記事一覧

BM法による文字列マッチング学習メモ

grepで文字列マッチングしている時の仕組みを学ぶために、BM法などの文字列マッチングについて調べていた。調べたことをメモしておく。特にまとまってはいない。参考になった文献は以下。 文字列の中から効率良くキーワードを探し出せ:コーディングに役立つ…

問題解決のための質問群を学んだ - 「考える技術・書く技術」を読んだ

最近、自分は問題をうまく分割して解決する能力や、他の人に分かりやすく伝える能力がまだ足りていないと感じていた。そのあたりを強化するために、おすすめと言われた「考える技術・書く技術」を読んだ。考える技術・書く技術―問題解決力を伸ばすピラミッド…

ゴールを決め目標を決める・解決案ではなく質問する - コーチングの学習で学んだこと

半年前から会社でシニアエンジニアという役職で、エンジニアのメンターの役割を担っている。その役割を出来るだけうまく演じられるように、半年間はコーチングの学習を進めてきた。 目標設定の仕方を学ぶ - 「ザ・コーチ」読んだ - $shibayu36->blog; なぜ最…

Union Findアルゴリズムの様々な実装とパフォーマンス計測

CourseraにAlgorithms Part1という授業があり、これが非常に評判が良いので、会社で勉強会をしている。Week1にUnion Findというアルゴリズムが出てきて、その実装パターンがいくつかあった。それぞれ計算量が違うらしいのだけど、速度がどのように変化するか…

「ウェブ小説の衝撃」読んだ

ウェブ小説のドメイン知識を知りたかったので読んだ。ウェブ小説の衝撃: ネット発ヒットコンテンツのしくみ (単行本)作者:飯田 一史筑摩書房Amazon印象に残ったのは以下の二点。小説家になろうで小節ごとのアクセス数が公開されていることで、版元が判断しや…

様々な価値観を持った人の生の声を聞ける「現役東大生が1日を50円で売ってみたら」読んだ

現役東大生が1日を50円で売ってみたら作者:高野 りょーすけKADOKAWAAmazon読んだ。非常に面白かった。自分はエッセイやノンフィクションの本は読んだことはあまりなかったのだけど、今後はいろいろ探してみようかなと思うくらいに面白かった。著者が1日を50…

登場人物を分類し、振る舞いを分解して、機能を考える(企画職の人に教えてもらったこと)

本職の企画の人が優れた機能案を出してくる理由がわからなくて、どうやってやってるんですかと雑談した。新たな発見があったので、雑なメモだけ残しておく。*1 その人の企画の流れ 企画の流れは、以下の3ステップで行っているらしい。 1. 登場人物を分類する…

「検索エンジン自作入門」を読んだ

Elasticsearchが裏でどのように動いているか理解できるようにするために、「検索エンジン自作入門」を読んだ。検索エンジン自作入門 ~手を動かしながら見渡す検索の舞台裏作者:山田 浩之,末永 匡技術評論社Amazonこの本を読んで、検索エンジンがやっているこ…

1月に読んで面白かった漫画

1月も漫画をいろいろ読んだ。その中で面白かった漫画を残しておく。 地球の放課後 スピリットサークル げんしけん ホブゴブリン 春の呪い ヒロシ戦記 地球の放課後 地球の放課後(1) (チャンピオンREDコミックス)作者:吉富昭仁秋田書店Amazon人類が消えた…

どうやったら発見した問題をうまく放置できるようになるのか

仕事をしていると、様々な問題が発見される。問題を発見した時、とにかくすぐに対処しようとしてしまうことが多い。しかし、そうしていると、タスク量が増えてきたときに問題解決に忙殺され、もっと重要なことに取り掛かれないということが起こりがちである…

「無印良品は、仕組みが9割」を読んだ

昨夜なぜか眠れなかったので、積んであった「無印良品は、仕組みが9割」を一気読みした。[asin:4041104998:detail]この本は無印良品の業績が悪くなっていたときに、「仕組み」をうまく作ることで業績を改善した話について書かれていた。書かれている具体的…

転置インデックスの構造から見る全文検索

全文検索エンジンについて学んでいたのだけど、転置インデックスのデータ構造という観点から見るといろいろ面白かったのでまとめてみる。 転置インデックスの具体的な構造 全文検索では、転置インデックス(Inverted index)という仕組みを使う。詳しくは第3回…

「ヒーローは眠らない」読んだ

ヒーローは眠らない (富士見L文庫)作者:伊丹央KADOKAWAAmazon読んだ。戦隊モノを撮るプロデューサーの話で、そういうストーリーを読んだことがなく、新鮮に読めた。語り口調もテンポよく、飽きずに一気に読めて、非常に楽しめた。基本的にはお仕事物という感…

WikipediaのXMLデータから文書を1000件含むXMLファイルを作成するワンライナー

検索エンジン自作入門 ~手を動かしながら見渡す検索の舞台裏作者:山田 浩之,末永 匡技術評論社Amazon検索エンジン自作入門を見ていて、WikipediaのXMLデータから文書を1000件含むXMLファイルを作成するワンライナーが出てきて、非常に勉強になったのでメモ。…

極大部分文字列について調べた

社内の技術勉強会で極大部分文字列というワードが出てきたので、自分で調べた内容をメモ。内容があっているかは保証しない。 極大部分文字列とは何か 定義は 全ての部分文字列を考慮した文書分類 に書いてある これによると、「極大部分文字列の必要十分条件…

田中圭一さんの「うつヌケ」を読んで欲しい

田中圭一さんの「うつヌケ」というコミックエッセイを読んだ。とにかくむちゃくちゃ良かった。うつヌケ うつトンネルを抜けた人たち 【電子書籍限定 フルカラーバージョン】 (角川書店単行本)作者:田中 圭一KADOKAWAAmazonいろんな人にインタビューしていて…

「数学ガール/乱択アルゴリズム」を読んだ

アルゴリズム読み物を読みたくて、いろんなところでオススメされている数学ガールの乱択アルゴリズムを読んだ。なかなか興味深かった。数学ガール/乱択アルゴリズム (数学ガールシリーズ 4)作者:結城 浩Softbank Creative/Tsai Fong BooksAmazonこの本で興味…

パーフェクトJavaを読んだ

最近アルゴリズムの勉強でJavaを使っていて、いい機会だしどうせならJavaの言語の詳細な機能や考え方などを知りたいと思っていた。Javaをやっている人に聞いてみると「パーフェクトJava」が良いということなので読んでみた。改訂2版 パーフェクトJava作者:井…

勇者のクズ読んだ

[asin:B01N7JQX9K:detail]読んだ。肉体を改造したヤクザが魔王と呼ばれ、それを合法的に狩る職種のことを勇者と呼ぶような世界のお話。設定が独特な一方、肉体を強化する薬を投入すると、それぞれの人ごとに特殊な力を習得できるため、その点では王道ファン…

Suffix Arrayを使った文字列マッチング

あるPatternがあるText中のどこに含まれるかという文字列マッチングの実装を最近してみている。前回、Suffix Trieでの文字列マッチングを行った。blog.shibayu36.orgSuffix Trieを利用すると、Suffix Trieを最初に構築したあと、実際にパターンを検索するの…

CircleCIでJava8 + Gradleプロジェクトのテストを行う

興味本位で自分のアルゴリズム実装repository( https://github.com/shibayu36/algorithms )のテストをCircleCIで動かしてみようと考えた。基本的にCircleCIはcircle.ymlに設定を追加したら終わりなのだけど、何を設定すればいいか少し調べる必要があったので…

冪集合を作るメソッドをジェネリクス対応する

以前 Javaで冪集合を生成する - アルゴリズム学習(その3) - $shibayu36->blog; で冪集合を作るメソッドを実装していた。しかし、以前の実装だとListでしか冪集合を作ることができなかった。最近パーフェクトJavaを読んで、ジェネリクスについて学んだので、…

ハッカソン旅行 in 和倉温泉

和倉温泉に旅行に行きました。観光 & プログラミングをしていました。AKB丼(甘エビ・カニ・ブリ丼)を食す。 生卵を買うと、自分で温泉卵に出来る。塩分が強い温泉なので、自然と味がついていた。 こいつ自分も卵のキャラなくせに、絶対に子供を温泉卵にしよ…

Suffix Trieを使って文字列マッチングする

文字列マッチングを行うためのアルゴリズムとして、Suffix Trieを使った探索というものがある。これはテキストからSuffix Trieという構造を作り、パターンをつかってそれを辿ることで、パターンの長さmに対して、O(m)の計算量で探索できるものである。今回は…

nanobenchを使ってJavaのベンチマークを取る

アルゴリズムを学習していると、ある実装の速度がどのくらいか計測したいことがよくある。これまでは、currentTimeMillisを利用して、愚直にベンチマークを取っていたのだけど、結構だるい感じだった。調べてみると、jmh と nanobench という二つのツールが…

「世界でもっとも強力な9のアルゴリズム」読んだ

なんとなくアルゴリズム系の読み物読んでみたかったので読んだ。世界でもっとも強力な9のアルゴリズム作者:ジョン・マコーミック日経BPAmazonこの本は、著者が3つの基準で選んだ「偉大なアルゴリズム」について、エンジニアでなくても分かるような簡単な言葉…

基礎技術の学習のモチベーションをどう保つか

最近、コンピュータサイエンスなどの基礎的な知識を学習するように心がけている。できる限り今後も長い期間役に立つ、寿命の長い技術や知識を付けておきたいためである。その一貫で アルゴリズムを学習 してみている。 学習をはじめて感じた課題 しかし、と…

文字列マッチングのためのLCP Arrayを構築する

前回のブログ記事で、文字列マッチングをするためのSuffix Arrayという構造を構築した。このSuffix Arrayという構造だけでも、テキスト長をn、パターン長をmとして、の計算量で文字列マッチングできるようになった。 suffix arrayを一番簡単なアルゴリズムで…

Chrome Developer ToolsのTimeline -> Bottom-Up -> Group by URLが便利だった

アニメーションが遅い問題を調査していて、どうやって原因を特定すれば良いかわからない状態だった。それをチャットで会話していたら同僚が「Chrome Developer ToolsのTimeline -> Bottom-Up -> Group by URL使うと良さそう」みたいなことを教えてくれた。使…