TEdb project on Starrydata

日本熱電学会の熱電特性データベースWGが主催する、学術論文からの熱電特性データベース構築プロジェクトのブログです。

熱電特性グラフが掲載されている論文のリストの入手方法

データ収集アルバイトとしてまとまった数の論文を一気にデータ収集したい方や、熱電材料の材料系ごとに一気にデータをダウンロードしたい方のために、熱電特性グラフが載っている論文のDOIのリストを作成し、GitHub上で公開しました。

doilist_all.txtが、現在私達の手元にある全ての論文の分類結果です。
doilist_数字_材料系名.txtが材料系ごとに分割した分類結果です。

このDOIリストをStarrydata2にアップロードすれば、マイリストとしてまとめることができ、対象論文を効率よく処理できます。

なお、このDOIリストに入っている論文は、2015年までに出版された論文です。2016年以降の論文は、今後分類が終了次第、改めて更新したいと思います。また、本プロジェクトチームの検索・分類手順の不備により、本来登録されるべき論文が抜けている可能性も十分にあります。それらの未収録論文を使いたい場合は、お手数ですが自分でそれらの論文のDOIを指定・追加してご利用ください。

以下で、詳細な手順を画像つきで説明します。

DOIリストの入手

1. Starrydata2のメニューバーから、Datasetsにアクセスします。
f:id:mibeginner:20180801154923p:plain

2. GitHubのページが現れますので、doilistフォルダにアクセスします。
f:id:mibeginner:20180801155115p:plain

3. doilistフォルダから、興味のあるdoilistを選択してクリックします。
f:id:mibeginner:20180801155825p:plain

4. 現れたDOIリストをコピーまたはダウンロードします。
f:id:mibeginner:20180801160541p:plain

DOIリストからのマイリストの作成

1. (任意)Starrydata2の画面左のCreate list欄にマイリスト名を入力して、画面内の+もしくはEnterキーを押すことで、新規マイリストを作成します。
f:id:mibeginner:20180801164434p:plain

2. 論文を追加したいマイリストを表示させた状態で、コピーしたDOIリストを画面左下のUpload papersテキストボックスにペーストし、Uploadボタンを押します。
f:id:mibeginner:20180801161159p:plain

3. DOIを手がかりにStarrydata2が情報を収集します。Now loadingの表示が消えてFinishedと表示されるまで、しばらく待機します。もし情報の収集に失敗したDOIがある場合は、Finishedの表示とともに、失敗した論文のDOIがピンク色で表示されます。
f:id:mibeginner:20180801161618p:plain

論文リストを使ったデータ収集アルバイト

1. データ収集がすでに行われている論文は、fignum:の欄に1以上の数字が入っています。まだデータ収集が行われていない論文は、fignum:0と表示されているので、もしアルバイトとしてデータ収集を行いたい場合はfignum:0の論文を選んでください。
f:id:mibeginner:20180801162224p:plain

2. 選択した論文のLinkをクリックしてください。出版社のページが現れたら、PDFを表示してください。
f:id:mibeginner:20180801162547p:plain

3. PDFを見て、もしデータ収集できそうなグラフがあったら、グラフのスクリーンショットを撮って、データ収集を行ってください。データ収集方法と、作業内容をLancersで申告する方法の詳細は、後ほど別のページで説明します。

論文リストからのデータダウンロードとデータ処理

英語になってしまいますが、以下のページの手順を参照してください。
How to use Starrydata JSON filesstarrydata.wordpress.com