データ収集アルバイト@Lancers
Starrydataによるデータ収集アルバイトをLancers上で始めました。
熱電特性の論文を読んでStarrydata2にデータを登録していただき、組成・製法などの試料情報を記入していただくくことで、論文1本あたり1000円をお支払いできるようになりました。
準備
1. Lancersアカウントの作成
・Lancersのアカウント名は不特定多数が見るので、個人を特定できないものがおすすめです。
・振込先銀行口座を指定します。
・出金形式がキャリーオーバー形式がお勧めです。好きなときにまとめて出金できるように手数料が最小限ですみます。
・報酬が年間合計20万円以上になると確定申告が必要になるかもしれないので注意してください。源泉徴収票が費用ような場合はLancersのアカウント管理から出せるようです。
・学振の特別研究員の場合も、事前に報酬受給届を受入研究員(指導教官)に提出し、毎年の研究報告書の提出時に報酬受給届の写しを添付すれば、報酬の受け取りは可能なようです。
2. Starrydata2アカウントの作成
Starrydata上では、本名もしくはLancersのアカウント名でアカウントを作成してください。
(注)Starrydata2はInternet Explorerでは動作しません。Google Chromeをおすすめします。
http://www.starrydata2.org/signup
3.データ収集作業
1. Starrydata2のThermoelectricMaterialsデータベースに入り、まだ誰もデータ収集を行っていない熱電特性の論文の中から、論文を1本選びます。
・まだデータ収集されていない論文とは、fignum:0と表示されている論文です。
・キーワードを指定して検索することで、興味の持てる論文を探すことができます。検索結果をマイリストとして保存し、上から順番に作業していくこともできます。
・データ収集したい論文が決まっているものの、その論文がStarrydata2で見つからないときは、Upload Paper欄にDOIを入力することで論文が登録され、使えるようになります。
・論文PDFを持っていない場合は、'Link'をクリックして出版社のページにアクセスします。(もし入手できない場合はご相談ください。)
http://www.starrydata2.org
2. 論文PDFから、データ収集対象グラフ(熱電特性の温度依存性のグラフ)を探します。
データ収集対象グラフは、横軸が温度で、縦軸が以下の熱電特性であるグラフです。
・ゼーベック係数 Seebeck coefficient / 熱起電力 Thermopower
・電気伝導率 Electrical conductivity / 電気抵抗率 Electrical resistivity ρ
・熱伝導率 (Total) thermal conductivity
(格子/電子熱伝導率は全熱伝導率があれば不要です)
・出力因子 Power factor P
・無次元性能指数 ZT (Dimensionless / thermoelectric figure of merit ) / 性能指数 Z
・キャリア濃度 Carrier concentration (density) / ホール係数 Hall coefficient
3. 論文PDFから、データ収集対象のグラフを1枚、スクリーンショット(スナップショット)としてコピーします。
4. 作業中の論文の'Data'ページを開き、その下部にあるWebPlotDigitizerに、コピーした画像をペーストします。
・ショートカットキー(Ctrl+Vなど)でペーストできます。
・Google Chrome以外では、ペーストがうまくいかないかもしれません。
・ペーストがうまくいかない場合は画像として保存して、WebPlotDigitizerのメニューから画像ファイルを開きます。
5. WebPlotDigitizerの中で、指示に従って軸の校正をします。
・X軸、Y軸の最小値・最大値付近のキリの良い点を順番に4点クリックします。
・各点のグラフの読みを入力します。
・単位変換はこの時点では不要です。
・軸が途中で//などの線で切れている場合や、実は右の軸を参照している場合などがあるので、注意してください。
6. Dataページ上部のグレーの領域の右上にあるEditボタンを押し、Saveボタンを表示させます。
7. グラフのFigureNameを入力して、Enterを押します。
・Figure 2(a)であれば2(a)もしくは2aなどと書くことができます。
・1つのグラフに複数の軸やインセットなどがある場合は、軸ごとに独立なFigureと登録する必要があるため、それぞれ適当なFigureNameをつけて登録してください。
・1つの論文内で、他のFigureと重複しないようなFigureNameをつけてください。
・新規FigureNameの入力後は、Enterを忘れずに押してください。Enterによって新しいFigureが生成されます。
・同じ論文内で1度以上使われたFigureNameは、プルダウンから選択して再利用できます。この場合はEnterは必要ありません。
8. データを収集する試料を1つ選びます。
・参考文献の番号がついているデータは、別の論文のデータなので、収集の必要はありません。
・理論計算結果やフィッティングカーブなど、実験結果でないものは収集の必要はありません。
9. SampleNameを決めて入力し、Enterを押します。
・グラフの凡例かキャプションに書いてある試料名をベースに、SampleNameを決めてください。
・新規SampleNameの入力後は、Enterを忘れずに押してください。Enterによって新しいSampleが生成されます。
・同じ論文内で1度以上使われたSampleNameは、プルダウンから選択して再利用できます。この場合はEnterは必要ありません。
・1つの論文内で、同じ名前で表示されている複数の試料がある場合は、重複しないSampleNameを適当に設定してください。
10. 試料情報の入力
・試料の化学組成が論文からわかる場合は、Composition欄に入力します。
・計算や入力が面倒な場合は、空欄のままで結構です。入力しなくても、あとで別の人が論文を読んで入力を行うので問題ありません。
・カッコや文字式は使わずにモル比で書いてください。
・フラックス法など出発組成と生成物の組成が大きく異なる場合を除き、出発組成を記入すれば大丈夫です。特に、EDX/EDSなどによる組成は誤差が大きいので注意してください。
11. WebPlotDigitizerで、SampleNameに対応する試料のグラフをトレースします。
・詳しい使い方は英語TutorialページまたはWebPlotDigitizerのサイトを参照してください。
・色分けされているグラフでは自動抽出が便利です。
・うまくいかない場合は、マニュアル抽出を選んで、マウスクリックで収集します。
・データ点が多すぎる場合は、適当に間引いて収集しても大丈夫です。あとで、多項式フィッティングで補間されます。
・View data機能で表示して、データをクリップボードにコピーします。
12. データを、Starrydata2の大きなテキストボックスにペーストします。
13. グラフを読んで、X軸、Y軸の物理量と単位を記入します。
・さまざまな組立単位・合成単位を自動認識できます。
・新規単位を使いたい場合は、入力後にEnterを押して新規単位をシステムに登録してください。
・単位の前や軸の端などに10のn乗と書いてある場合は、nの値も入力してください。
・単位の前などではなく、物理量の前に10のn乗と書いてある場合は、nではなく-nを入力してください。
・データ収集作業に置いて最も間違いやすく、間違えた場合の誤差も甚大なので、注意してください。
14. Saveを押します。
・テキストボックス内のデータが、接頭詞なしのSI単位系に変換されて登録されます。
・登録されたデータが、右のグラフに表示されます。
15. 以上のデータ収集作業を他の試料、他のグラフについても繰り返します。
・熱電特性の温度依存性のグラフがすべて収集されていればOKです。
・その他のグラフを抽出するかどうかは自由とします。
・グラフではなく、表や本文から得られる情報の登録は任意です。
16. 試料名をクリックし、各試料の情報を記入します。
・論文の実験方法などを読んで、試料情報を入力してください。
・プルダウンから大まかな分類を行い、詳細をコメント欄に英語で書いてください。
・試料情報記入の詳細は、別エントリで紹介します。
作業完了の申告
1. 論文中の全収集対象グラフのトレースが終わったら、以下のLancersの仕事依頼ページにアクセスし「作業を開始する」を押します。
https://www.lancers.jp/work/detail/2026144
2. 一番下の欄に、データ収集を行った論文のDOIを入力して送信します。
もしデータを論文投稿/学会発表する際に、共著者に含めることを希望するか、謝辞に名前を載せることを希望する場合は、メールにてご連絡ください。