TEdb project on Starrydata

日本熱電学会の熱電特性データベースWGが主催する、学術論文からの熱電特性データベース構築プロジェクトのブログです。

試料情報の記入方法(暫定)

Starrydataにおいて最も難しく、かつ重要な作業は試料情報記入です。
論文の本文を読んで、試料の製法を理解したうえで、それを分類し、詳細を英語で記入します。

Form 試料形態

SingleCrystal 単結晶
Bulk バルク(多結晶など)
OrientedBulk 多結晶配向体
EpitaxialFilm エピタキシャル薄膜
Film 薄膜
Ribbon リボン
Wire ワイヤー/チューブ
Device バイス(ナノテク系)
Module モジュール
Other その他
unknown 不明

詳細はコメント欄に書いてください。

Purity 純度

SinglePhase 単相
MainPhase 不純物はあるが主相
Precipitates 粒内析出物が形成
EutecticComposite 共晶組織の複合材料
MetalComposite 金属との複合材料
Composite 金属以外との複合材料
Other その他
unknown 不明

詳細があればコメント欄に書いてください。

FabricationProcess 最終合成プロセス

プルダウンからは、試料の特性に大きく影響していると考えられる合成プロセスをおおまかに選んでください。試料の特性に最も影響するのは、最後の合成プロセスであることが多いと思いますので、もしわからなければ最後のプロセスを選んでください。(例:アークメルト合成→粉砕→SPS焼結の場合は、PressureSintering)

MeltGrowth 溶融体からの結晶成長 ブリッジマン法、チョクラルスキー法、溶融凝固、FZ法、方向凝固法
FluxGrowth (組成の違う)液体中での結晶成長 フラックス法、自己フラックス法
VaporGrowth 気相中での結晶成長 Vapor Transport法など
FilmGrowth 薄膜成長 スパッタリング, PLD, MBE, CVDなど
Melting 溶融法 アークメルト法、高周波加熱炉など
MeltQuench 液体急冷法
HighPressureSynthesis 高圧合成(GPaレベル) マルチアンビル、ダイヤモンドアンビル
PressureSintering プレス焼結(MPaレベル) SPS, ホットプレス, 静水圧プレス(静水圧は等方的圧力という意味なので、水熱合成とは違う)
Sintering 焼結(常圧・融点以下での熱処理) 電気炉など
MechanicalAlloying カニカルアロイング 常温のボールミルだけで加熱せずに合成が完了するもの
SoftChemical 溶液法(水溶液を加熱焼結) 錯体重合法など
Hydrothermal 水熱合成・ソルボサーマル 高温・高圧の水中での合成
Organic 有機合成有機物から出発するもの)
Other その他
unknown 不明

合成プロセスに関する詳しい情報はコメント欄に英語で書いてください。

ElectricalMeasurement 電気的測定

SteadyState+4P S: 定常法, σ: 四端子法 通常の熱電特性測定装置(ULVAC/アドバンス理工のZEM-3)など
SteadyState+2P S: 定常法, σ: 二端子法 ディスク法など
SteadyState+vdP S: 定常法, σ: van der Pauw法 S:単独測定、σ:ホール係数との同時測定など
Harman ハーマン法(S、σ、κの同時測定)
PPMS-TTO (Quantum Design社 Physical Property Measurement System) のThermal Transport Optionなど
MicroProbe マイクロプローブ法(スキャン) 熱電特性マッピングなど
Other その他
unknown 不明

ThermalMeasurement 熱伝導率測定

LaserFlash+DSC レーザーフラッシュ(比熱はDSC)
LaserFlash レーザーフラッシュ
LaserFlash+3R レーザーフラッシュ(比熱はDulong-Petit則)
Harman ハーマン法(S、σ、κの同時測定)
PPMS-TTO (Quantum Design社 Physical Property Measurement System) のThermal Transport Optionなど
Disc ディスク法
3omega 3ω法 ナノワイヤーの測定など
ThermoReflectance サーモリフレクタンス法
Kph(RT)+Kel(WF) 室温の格子熱伝導率+WF則
Other その他
unknown 不明


分類方法は、まだまだ不備があるかと思います。
・分類がおおざっぱすぎると、細かな試料の違いが表現できない
・分類項目が細かすぎると面倒くさく見えて作業者のやる気が失せてしまう
という2つの間でバランスを見出さなければなりません。

いろんな論文と向き合うことで、改善案が見えてくると思います。
・これとこれは別カテゴリにした方がいい
・こういうカテゴリがあると良い
など、分類方法やカテゴリの増設希望などがあれば、このブログのコメント欄に記入してください。

提案の際には、「理想のデータ収集」を追求するのではなく、「こうした方が自分がサクサク気持ちよく記入できる」というデータ収集者の感情面を重視していただけると助かります。

活発なディスカッションを期待します。よろしくお願いします。

データ収集アルバイト@Lancers

Starrydataによるデータ収集アルバイトをLancers上で始めました。

熱電特性の論文を読んでStarrydata2にデータを登録していただき、組成・製法などの試料情報を記入していただくくことで、論文1本あたり1000円をお支払いできるようになりました。

準備

1. Lancersアカウントの作成

・Lancersのアカウント名は不特定多数が見るので、個人を特定できないものがおすすめです。
・振込先銀行口座を指定します。
・出金形式がキャリーオーバー形式がお勧めです。好きなときにまとめて出金できるように手数料が最小限ですみます。
・報酬が年間合計20万円以上になると確定申告が必要になるかもしれないので注意してください。源泉徴収票が費用ような場合はLancersのアカウント管理から出せるようです。
・学振の特別研究員の場合も、事前に報酬受給届を受入研究員(指導教官)に提出し、毎年の研究報告書の提出時に報酬受給届の写しを添付すれば、報酬の受け取りは可能なようです。

2. Starrydata2アカウントの作成

Starrydata上では、本名もしくはLancersのアカウント名でアカウントを作成してください。
(注)Starrydata2はInternet Explorerでは動作しません。Google Chromeをおすすめします。
http://www.starrydata2.org/signup

3.データ収集作業

1. Starrydata2のThermoelectricMaterialsデータベースに入り、まだ誰もデータ収集を行っていない熱電特性の論文の中から、論文を1本選びます。
・まだデータ収集されていない論文とは、fignum:0と表示されている論文です。
・キーワードを指定して検索することで、興味の持てる論文を探すことができます。検索結果をマイリストとして保存し、上から順番に作業していくこともできます。
・データ収集したい論文が決まっているものの、その論文がStarrydata2で見つからないときは、Upload Paper欄にDOIを入力することで論文が登録され、使えるようになります。
・論文PDFを持っていない場合は、'Link'をクリックして出版社のページにアクセスします。(もし入手できない場合はご相談ください。)
http://www.starrydata2.org

2. 論文PDFから、データ収集対象グラフ(熱電特性の温度依存性のグラフ)を探します。
データ収集対象グラフは、横軸が温度で、縦軸が以下の熱電特性であるグラフです。
・ゼーベック係数 Seebeck coefficient / 熱起電力 Thermopower
・電気伝導率 Electrical conductivity / 電気抵抗率 Electrical resistivity ρ
・熱伝導率 (Total) thermal conductivity
(格子/電子熱伝導率は全熱伝導率があれば不要です)
・出力因子 Power factor P
・無次元性能指数 ZT (Dimensionless / thermoelectric figure of merit ) / 性能指数 Z
・キャリア濃度 Carrier concentration (density) / ホール係数 Hall coefficient

3. 論文PDFから、データ収集対象のグラフを1枚、スクリーンショット(スナップショット)としてコピーします。

4. 作業中の論文の'Data'ページを開き、その下部にあるWebPlotDigitizerに、コピーした画像をペーストします。
・ショートカットキー(Ctrl+Vなど)でペーストできます。
Google Chrome以外では、ペーストがうまくいかないかもしれません。
・ペーストがうまくいかない場合は画像として保存して、WebPlotDigitizerのメニューから画像ファイルを開きます。

5. WebPlotDigitizerの中で、指示に従って軸の校正をします。
・X軸、Y軸の最小値・最大値付近のキリの良い点を順番に4点クリックします。
・各点のグラフの読みを入力します。
・単位変換はこの時点では不要です。
・軸が途中で//などの線で切れている場合や、実は右の軸を参照している場合などがあるので、注意してください。

6. Dataページ上部のグレーの領域の右上にあるEditボタンを押し、Saveボタンを表示させます。

7. グラフのFigureNameを入力して、Enterを押します。
・Figure 2(a)であれば2(a)もしくは2aなどと書くことができます。
・1つのグラフに複数の軸やインセットなどがある場合は、軸ごとに独立なFigureと登録する必要があるため、それぞれ適当なFigureNameをつけて登録してください。
・1つの論文内で、他のFigureと重複しないようなFigureNameをつけてください。
・新規FigureNameの入力後は、Enterを忘れずに押してください。Enterによって新しいFigureが生成されます。
・同じ論文内で1度以上使われたFigureNameは、プルダウンから選択して再利用できます。この場合はEnterは必要ありません。

8. データを収集する試料を1つ選びます。
・参考文献の番号がついているデータは、別の論文のデータなので、収集の必要はありません。
・理論計算結果やフィッティングカーブなど、実験結果でないものは収集の必要はありません。

9. SampleNameを決めて入力し、Enterを押します。
・グラフの凡例かキャプションに書いてある試料名をベースに、SampleNameを決めてください。
・新規SampleNameの入力後は、Enterを忘れずに押してください。Enterによって新しいSampleが生成されます。
・同じ論文内で1度以上使われたSampleNameは、プルダウンから選択して再利用できます。この場合はEnterは必要ありません。
・1つの論文内で、同じ名前で表示されている複数の試料がある場合は、重複しないSampleNameを適当に設定してください。

10. 試料情報の入力
・試料の化学組成が論文からわかる場合は、Composition欄に入力します。
・計算や入力が面倒な場合は、空欄のままで結構です。入力しなくても、あとで別の人が論文を読んで入力を行うので問題ありません。
・カッコや文字式は使わずにモル比で書いてください。
・フラックス法など出発組成と生成物の組成が大きく異なる場合を除き、出発組成を記入すれば大丈夫です。特に、EDX/EDSなどによる組成は誤差が大きいので注意してください。

11. WebPlotDigitizerで、SampleNameに対応する試料のグラフをトレースします。
・詳しい使い方は英語TutorialページまたはWebPlotDigitizerのサイトを参照してください。

・色分けされているグラフでは自動抽出が便利です。
・うまくいかない場合は、マニュアル抽出を選んで、マウスクリックで収集します。
・データ点が多すぎる場合は、適当に間引いて収集しても大丈夫です。あとで、多項式フィッティングで補間されます。
・View data機能で表示して、データをクリップボードにコピーします。

12. データを、Starrydata2の大きなテキストボックスにペーストします。

13. グラフを読んで、X軸、Y軸の物理量と単位を記入します。
・さまざまな組立単位・合成単位を自動認識できます。
・新規単位を使いたい場合は、入力後にEnterを押して新規単位をシステムに登録してください。
・単位の前や軸の端などに10のn乗と書いてある場合は、nの値も入力してください。
・単位の前などではなく、物理量の前に10のn乗と書いてある場合は、nではなく-nを入力してください。
・データ収集作業に置いて最も間違いやすく、間違えた場合の誤差も甚大なので、注意してください。

14. Saveを押します。
・テキストボックス内のデータが、接頭詞なしのSI単位系に変換されて登録されます。
・登録されたデータが、右のグラフに表示されます。

15. 以上のデータ収集作業を他の試料、他のグラフについても繰り返します。
・熱電特性の温度依存性のグラフがすべて収集されていればOKです。
・その他のグラフを抽出するかどうかは自由とします。
・グラフではなく、表や本文から得られる情報の登録は任意です。

16. 試料名をクリックし、各試料の情報を記入します。
・論文の実験方法などを読んで、試料情報を入力してください。
・プルダウンから大まかな分類を行い、詳細をコメント欄に英語で書いてください。
・試料情報記入の詳細は、別エントリで紹介します。

作業完了の申告

1. 論文中の全収集対象グラフのトレースが終わったら、以下のLancersの仕事依頼ページにアクセスし「作業を開始する」を押します。
https://www.lancers.jp/work/detail/2026144

2.  一番下の欄に、データ収集を行った論文のDOIを入力して送信します。
もしデータを論文投稿/学会発表する際に、共著者に含めることを希望するか、謝辞に名前を載せることを希望する場合は、メールにてご連絡ください。

論文からのデータ収集において、著作権を侵害することはありません

論文のグラフからデータを収集することは、著作権を侵害してしまうのではないか?
と、心配される方もいらっしゃると思います。
確かに、論文の文章や画像は、著作物です。

しかし、下記の高裁判決にありますように、論文のデータ自体には著作性が否定されています。

平成17年(ネ)第10038号 著作権侵害差止等請求控訴事件

「実験結果等のデータ自体は,事実又はアイディアであって,著作物ではない以上,そのようなデータを一般的な手法に基づき表現したのみのグラフは,多少の表現の幅はあり得るものであっても,なお,著作物としての創作性を有しないものと解すべきである。なぜなら,上記のようなグラフまでを著作物として保護することになれば,事実又はアイディアについては万人の共通財産として著作権法上の自由な利用が許されるべきであるとの趣旨に反する結果となるからである。」

Starrydataでは、論文の文章や画像をアップロードせずに、元データ(事実)のみをアップロードするシステムとなっております。
また、必ず元論文を引用してデータを公開しています。

よって、Starrydataを使って論文のグラフ画像から元データを収集して公開する行為自体は、著作権を侵害する恐れはありません。

Starrydata APIの使い方

Starrydataに登録されている情報を、コマンドから直接ダウンロードする機能(API)ができましたので紹介します。

1. 試料検索

WebブラウザのURLバーに以下の文字列を入れます。

https://www.starrydata2.org/paperlist/api/paper/search?atom=Bi,Te

すると、組成式にBiとTeを含む試料を含む論文のpaperid(SID)のリストがブラウザに表示されます。出力はJSON形式です。(見やすくするため出力結果に改行を加えています)

{
    "paperid": [161, 3, 7975, 11497, 18603, 3282, 1711, 3792, 721, 2098, 18569, 18616, 18096, 13057, 1533, 8702], 
    "sampleid": [], 
    "figureid": []
}

デフォルトはAND検索です。atom=Bi,Te,orと書けばOR検索となり、BiまたはTeを含む論文のリストが表示されます。

上の作業は、コマンドライン(UNIX)で以下のように打ち込んでもできます。

続きを読む

初心者マニュアル(6) WebPlotDigitizer を使ってデータを収集しましょう

www.youtube.com

収集対象のグラフをPDFから切り出します(編集→スナップショット)。
切り出したグラフを Ctrlキーとvキーを押すことで、WebPlotDigitizerに貼り付けます。
XY軸の4点を決めて数値を入力します。
収集対象となるサンプルの数(=datasetの数)を設定します。
サンプル毎にデータを収集していきます。

Starrydata関連の講演予告(2018秋)

Starrydata Webシステムとその応用に関しまして、この秋は以下の学会・講演会で発表を予定しています。

第1回データ利活用研究コミュニティWS

日時:2018年9月5日(水)13:00-18:30
会場:東京大学本郷キャンパス 伊藤国際学術研究センターB2F
参加申込:https://webform.adm.u-tokyo.ac.jp/Forms/DP20180905/
東京大学所属の紹介者の名前が必要です)
ポスター発表を予定しています。

日本熱電学会学術講演会

日時:2018年9月13日(木)~15日(土)
場所:東北大学 青葉山キャンパス 
9/13(木) 15:00-16:30の「インフォマティクス」セッション内で4講演行います。
9/13(木)の夜に熱電特性データベースWGミーティングも行います。(メンバーにはメールで連絡済み)
http://www.thermoelectrics.jp/conference.html

第39回日本熱物性シンポジウム

日時:2018年11月13日(火)~15日(木)
会場:愛知県産業労働センター ウインクあいち11階(JR名古屋駅から徒歩5分)
http://jstp-symp.org/symp2018/


もしご興味がございましたらお越しください。