Elasticserachのgetting startedを読んでみた

クラスターとノードについて Elasticserachはクラスターの構築を想定しています。クラスターはクラスター名で識別し、クラスター内のノードを識別するためのUUIDはクラスター参加時にランダムな値が生成されます。ノード起動時に参加可能なクラスターが存在…

2018-06-19

モデル訓練のテクニック

モデル訓練のテクニック機械学習でパラメータを更新するためのテクニックについてまとめていきたいと思います。学習係数の決め方機械学習では学習係数をどう決めるかが学習の成否を大きく左右し、極めて重要になります。自動的に学習係数を決める手法で…

2018-06-17

Haskellで数独を解いてみた

関数プログラミング実践入門を読んだのでHaskellで数独を解いてみました。実装は以下のようになりました。

2018-06-16

Pythonでjanomeを使って形態素解析してみた

pipでjanomeを入れて形態素解析してみた今までPythonで日本語の形態素解析を入れる時はまずmecabをインストールしてからPythonから呼び出せるように共有ライブラリの依存関係を更新するなどして少し手間がかかっていたのですが、Pythonで作られた形態素解析…

2018-06-16

一般化線形モデルの訓練

一般化線形モデルの訓練についてまとめてみました。ちゃんと確認が取れているわけではなく、間違っている部分があるかもしれませんがご了承ください。誤差の削減損失関数によりモデルの当てはまりの良さの計算が行える。モデルの訓練では損失の計算、パ…

2018-06-10

Swiftで100マス計算を実装してみた

Swift

まず、実装したソースは以下のようになりました。 let col = [1,2,3,4,5,6,7,8,9,10] let row = [1,2,3,4,5,6,7,8,9,10] class Answer { let col: [Int] let row: [Int] let ans: [[Int]] init(col: [Int], row: [Int], ans: [[Int]]) { self.col = col; sel…

2018-06-09

言語処理のための機械学習入門を読んでみた

自然言語処理のための機械学習入門を読んだので載っていた内容を簡単にまとめたいと思います。 1.必要な数学的知識最適化問題確率論情報理論 2.文章および単語の数学的表現 nグラム(n-gram) 文書、文のベクトル表現文章に対する前処理とデータスパースネ…

2018-05-06

階層ベイズモデルについての読書メモ

岩波データサイエンス vol.1の読書メモ階層ベイズ最初の一歩階層ベイズモデル(階層事前分布を使った統計モデル)からベイズ統計モデルの良さを解説階層ベイズモデルは似たようなパラメータに制約を与える特徴がある → それによりパラメータが多い場合であ…

2018-05-03

Hadoopエコシステム周辺について

Hadoop Hadoop Distributed File System(HDFS) Yet Another Resource Negotiator(YARN) Apache Tez Apache Hive Apache Spark Apache Sqoop Apache ZooKeeper presto Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークとし…

2018-05-03

ユースケース駆動開発実践_実装

ユースケース駆動開発

ユースケース駆動開発実践_実装これまで進めてきたモデリングで実装をしてみました。ソースコードはこちらになります。 Javaで実装しDBアクセスのライブラリとしてMyBatisを使用しています。とりあえず、以下のユースケースに対応しています。ログイン商…

2018-05-03

ユースケース駆動開発実践_詳細設計

ユースケース駆動開発

ユースケース駆動開発実践ガイドに従うとユースケースモデリング(ユースケース図作成、ドメインモデリング)、概念設計(ロバストネス図の作成、ドメインモデルの更新)と進んだら次は詳細設計(シーケンス図作成、クラス図再生)になります。前回概念設計まで進…

2018-05-03

ユースケース駆動開発実践_分析・概念設計

ユースケース駆動開発

ユースケースモデリングにより以下のユースケース記述が作られたとして、次は分析・概念設計を進めたいと思います。 1.ログインするユーザはログイン画面を表示しユーザ名、パスワードを入力してログインボタンをクリックする。ログインに成功したら商品一…

2018-04-30

ユースケース駆動開発実践_要件定義

ユースケース駆動開発

前回ユースケース駆動開発の流れを掴めたので実際に開発を進めてみたいと思います。以下のECサイトの機能要求からドメインモデリングとユースケースを行いたいと思います。要求定義・ユーザはログイン画面でユーザ名、パスワードを入力してパスワード認証…

2018-04-30

ユースケース駆動開発実践ガイドメモ

ユースケース駆動開発

ユースケース駆動開発実践ガイドの読書メモ ICONIXプロセストとはドメインモデリングによって対象領域を理解し、ユースケースを書くことで顧客の要求を目に見える形でまとめ上げ、ロバストネス図によってソフトウェアの振る舞いを明確化し、シーケンス図に…

2018-04-28

ambariでhadoopクラスタ構築

ambari

Ambariとは OSSで作られているHadoop管理プラットフォーム。セキュアな（Kerberosベースの） Hadoopクラスタのインストールをサポートし、ロールベースのユーザー認証と許可そして監査機能を提供し、ユーザー管理のために LDAPと Active Directoryとの統合も…

2018-04-27

sbtのマルチプロジェクトでサブプロジェクトをimportする

以下のようにcoreとsubのマルチプロジェクトを作成しsubプロジェクトのSampleクラスをcoreプロジェクトのCoreクラスでimportして利用してみたいと思います。 . ├── build.sbt ├── core │ ├── src │ │ ├── main │ │ │ ├── resources │ │ │ └── scala │ │ │ └─…

2018-04-22

Ansibleでインターネットに繋がらない環境へPythonライブラリをインストールする

python

インターネットに繋がらないHadoopクラスタの各slaveに対してAnsibleでPythonのライブラリを管理することを想定して試してみましたので、その時の内容を書いておきます。 hadoopクラスタへのpythonライブラリ追加として、とりあえず以下のユースケースを追加…

2018-02-27

Typescriptで作成したパーサコンビネータを使ってJSONをパースしてみる

Typescript

以前作成したTypescriptでのパーサコンビネータを利用してJSONをパースしてみたいと思います。まずJSONの構文定義を確認してみます。確認したところarrayはelementsを含み,elementsはvalueを含みvalueはarrayを含むといった再帰的な構造を扱える必要がある…

2018-02-24

Typescriptでパーサコンビネータを書いてみる

Typescript

Typescriptは静的に型付があるので安全ではあるのですが、JavascriptではJSON.parseなどの結果を動的にたどることができたのに対してTypescriptでは静的型にして返す必要があり、Javascriptを書くときと比べて煩わしさがあったりします。Typescriptで自由な…

2018-01-21

Typescriptでの@typesメンテ不備の対応

ReactでTypescript開発をした際にハマったのでめも。 react-data-gridが便利そうだったので@types/react-data-gridも合わせてnpm innstall --saveでインストールしてみたのだがreact-data-gridで定義されている関数がTypescriptで利用することができなかった…

2018-01-14

Javaパフォーマンス(オライリー)を読んでみた

JVMの管理についてガベージコレクションやヒープメモリの調査方法などプログラミングをするだけではあまり意識しなかったことについて知れたのはよかったと思います。 2章パフォーマンステストのアプローチ Javaアプリケーションの正確なパフォーマンス測定…

2017-12-30

sshjを試してみた

javaで作られているsshクライアントであるsshjを試してみました https://github.com/hierynomus/sshj/blob/master/examples/src/main/java/net/schmizz/sshj/examples/LocalPF.java 単純にssh経由でコマンドを実行するだけでなくsshプロトコルを利用している…

2017-12-24

Haskellで100マス計算を解いてみた

Haskell

Haskellでの100マス計算を以下のように実装しました。 module Try.Hyakumasu where data MathData = MathData {col :: [Int], row :: [Int]} deriving (Show, Eq) hyakumasu :: (Int -> Int -> Int) -> MathData -> [[Int]] hyakumasu f x = [f c <$> (col x…

2017-12-17

Haskell学習中のメモ

Haskell

関数を定義する高階関数ラムダ式 map 型、型クラス型コンストラクタと型引数型変数型制約代数的データ型を定義する複数のデータコンストラクタを持つデータ型の定義データの正格性フラグフィールドの値の差し替え型シノニム newtype 型クラスファ…

2017-11-23

kaggleのTitanic問題をといてみる

kaggle

kaggleでチュートリアルがわりに使われているTitanicの問題を解いてみて実際に行われている分析の流れを把握できるようにしたいと思います。 kaggleでは個人の解答が公開、議論されているので普段分析をしない人でも学習にはちょうど良さそうな気がします。 …

2017-11-12

sbt assemlby実行時にリソースフォルダを変更できるようにしたい

scala

まずデフォルトのリソースフォルダを変更してみる sbt assemblyで実行可能jarを作成する際通常は"src/main/resources"がリソースフォルダとして使われますが、build.sbtにresourceDirectory in Compileの設定をすることによりデフォルトのリソースフォルダを…

2017-10-07

Sparkで状態を持つobjectを使い回す方法について調べてみた

Apache Spark

Sparkでの開発時に既存のjava資源を使用するのはよくあると思うけど、objectが状態を持っていて使い回す必要がある場合も考えられるのでその場合どうすれば良いのか調べてみました。まず以下のように引数で与えた値だけ内部のカウンターを増やすクラスがあ…

2017-10-07

ApacheSparkで扱うobjectのSerializableの必要性について

Apache Spark

ApacheSparkで扱うobjectのSerializableの必要性について hiveやファイルからデータを読み込んだ直後値はRDD, Dataset, DataFrameになっていて、少ないデータに対して何回もfilter処理を行う必要がある場合に一旦collectして配列に変換しdriver内で処理した…

2017-10-01

Scalaでseqを操作してみる

scala

scalaでSeqを操作してみるまず以下のcase classがあったとし、 case class Element(id: Int, time: java.sql.Timestamp) 初期のデータとして以下を保持する val elementSeq = Array( Element(1, new java.sql.Timestamp(new DateTime(2017, 8, 10, 16, 13).…

2017-10-01

sparkからhiveを利用してみる

Apache Spark

spark-shellにてクラスパスを指定する hive SQLを実行してみる summarizationsパターンを試してみる Datasetのapiを実行してみる spark-shellにてクラスパスを指定する spark-shell --driver-class-path 対象クラスパス開発時にちょっと修正後にいちいちビ…