熱電特性グラフが掲載されている論文のリストの入手方法
データ収集アルバイトとしてまとまった数の論文を一気にデータ収集したい方や、熱電材料の材料系ごとに一気にデータをダウンロードしたい方のために、熱電特性グラフが載っている論文のDOIのリストを作成し、GitHub上で公開しました。
doilist_all.txtが、現在私達の手元にある全ての論文の分類結果です。
doilist_数字_材料系名.txtが材料系ごとに分割した分類結果です。
このDOIリストをStarrydata2にアップロードすれば、マイリストとしてまとめることができ、対象論文を効率よく処理できます。
なお、このDOIリストに入っている論文は、2015年までに出版された論文です。2016年以降の論文は、今後分類が終了次第、改めて更新したいと思います。また、本プロジェクトチームの検索・分類手順の不備により、本来登録されるべき論文が抜けている可能性も十分にあります。それらの未収録論文を使いたい場合は、お手数ですが自分でそれらの論文のDOIを指定・追加してご利用ください。
以下で、詳細な手順を画像つきで説明します。
DOIリストの入手
1. Starrydata2のメニューバーから、Datasetsにアクセスします。
2. GitHubのページが現れますので、doilistフォルダにアクセスします。
3. doilistフォルダから、興味のあるdoilistを選択してクリックします。
4. 現れたDOIリストをコピーまたはダウンロードします。
DOIリストからのマイリストの作成
1. (任意)Starrydata2の画面左のCreate list欄にマイリスト名を入力して、画面内の+もしくはEnterキーを押すことで、新規マイリストを作成します。
2. 論文を追加したいマイリストを表示させた状態で、コピーしたDOIリストを画面左下のUpload papersテキストボックスにペーストし、Uploadボタンを押します。
3. DOIを手がかりにStarrydata2が情報を収集します。Now loadingの表示が消えてFinishedと表示されるまで、しばらく待機します。もし情報の収集に失敗したDOIがある場合は、Finishedの表示とともに、失敗した論文のDOIがピンク色で表示されます。
論文リストを使ったデータ収集アルバイト
1. データ収集がすでに行われている論文は、fignum:の欄に1以上の数字が入っています。まだデータ収集が行われていない論文は、fignum:0と表示されているので、もしアルバイトとしてデータ収集を行いたい場合はfignum:0の論文を選んでください。
2. 選択した論文のLinkをクリックしてください。出版社のページが現れたら、PDFを表示してください。
3. PDFを見て、もしデータ収集できそうなグラフがあったら、グラフのスクリーンショットを撮って、データ収集を行ってください。データ収集方法と、作業内容をLancersで申告する方法の詳細は、後ほど別のページで説明します。
論文リストからのデータダウンロードとデータ処理
英語になってしまいますが、以下のページの手順を参照してください。
How to use Starrydata JSON filesstarrydata.wordpress.com