オープンアクセスとその費用のポリシー

オープンアクセスについて、ゴールドオープンアクセス時にかかる費用をどのように負担するべきか調査した。

オープンアクセスの基礎知識

オープンアクセスには、大きく分けて二種類ある。

グリーンオープンアクセス:セルフアーカイビング。embargo期間を経て機関リポジトリなどに登録することで、誰でも論文が読めるようにする。

ゴールドオープンアクセス:論文公開直後から誰でも読める形で論文を公開する。論文の出版費用は著者が負担することになる。

wikipediaより:

One way is to publish it and then self-archive it in a repository where it can be accessed for free,[6][7] such as their institutional repository,[8][9] or a central repository such as PubMed Central. This is known as 'green' open access. Some publishers require delays, or an embargo, on when a research output in a repository may be made open access.[10] Several initiatives provide an alternative to the American and English language dominance of existing publication indexing systems, including Index Copernicus, SciELO and Redalyc.

A second way authors can make their work open access is by publishing it in such a way that makes their research output immediately available from the publisher.[11] This is known as 'gold' open access,[12] and within the sciences this often takes the form of publishing an article in either an open access journal,[13] or a hybrid open access journal. The latter is a journal whose business model is at least partially based on subscriptions, and only provide Gold open access for those individual articles for which their authors (or their author's institution or funder) pay a specific fee for publication, often referred to as an article processing charge.[14] Pure open access journals do not charge subscription fees, and may have one of a variety of business models. Many, however, do charge an article processing fee.

グリーンオープンアクセスは費用はかからないが、embargoが半年〜1年間設けられることがおおく、最新の論文を読むためには結局雑誌講読料(これが高騰し、大学関係者は困っている)を負担しなければならない。査読前のpreprintのセルフアーカイビングは、多くのジャーナルで認められているものの、最終盤ではないのであまり意味がないと私は思う。

オープンアクセスの費用

そういうわけで、ゴールドオープンアクセスにしたいのだが、これはこれで非常に高額。例えばNature communications(オープンアクセスジャーナル、インパクトファクターは10前後の一流誌)の投稿料は以下のとおり。

www.nature.com

£3,150 (UK and rest of world)
$5,200 (The Americas)
€3,700 (Europe)
¥661,500 (Japan)
RMB33,100 (China)

Plos系はもう少し安くて$1,495から。eLifeもついにpublication fee($2,500)を課すことになった。

elifesciences.org

他の一流誌よりは安いでしょ、ということらしいが。しかしこのレポートはよくまとまっているな。

オープンアクセスの義務化

ERC, Marie Curie, Wellcome Trustなどのヨーロッパ勢, NIHやHoward Hughesなどのアメリカの研究費助成団体は、オープンアクセスを義務化している。オープンアクセスは論文の出版から6ヶ月以内に行うことなど、グリーンオープンアクセスでもOKということになっている。

NIH系はpubmed centralに論文をアーカイブする。NIH funded researchersは、アクセプトされた稿を著者ホームページにアップロードするのもOK.

このあたりの事情がわかりやすくまとまっているのはElsevierのページではないかと思う。

Agreements

でもやっぱり6ヶ月経たないと読めないとなると、論文が最も注目を集めるプレスリリース時に一般の人は読めないことになってしまうので、市民への還元という意味ではやはり弱いのではないかと思う。

オープンアクセスの費用は誰が払うのか

ゴールドオープンアクセスにした時、その費用は誰が払うべきなのだろうか。だいたい著者が払う場合・大学など研究機関が払う場合・funding body(研究費助成団体)が払う場合の3つがあり得る。

著者が払う場合

研究費などから支払う。私が知る限り、「オープンアクセスのための費用は出せない」という研究費は日本にはないのではないかと思う。海外でも特に聞いたことはない。

大学が払う場合

大学によっては、オープンアクセスジャーナルと一括契約していて、XX大学から該当ジャーナルに出版される論文は、追加コストなしでOK、という場合がある。この場合は大学が払った、という解釈でいいと思う。

大学によっては、教職員がオープンアクセス雑誌に論文を載せる場合、費用を一部負担するという助成金の一種が用意されていることもある。

Funding bodyが払う場合

Funding bodyがオープンアクセスを推進している以上、費用も一部負担すべきでは?ということで、ゴールドオープンアクセスの費用を負担したり、グリーンオープンアクセスに関して有利な条件を出版社と結んだりしている。

ゴールドオープンアクセス時に発生する費用について、funding bodyが(申請しているグラントの枠外で)コストを負担してくれるのは以下のとおり。

  • Arthritis Research UK(著者が払えない場合)
  • Bill & Melinda Gates Foundation
  • Bloodwise(ただし例外的な扱い。大学などに所属していない場合)
  • British Heart Foundation
  • The Chief Scientist Office(上限あり)
  • Department of Health UK and the UK National Institute for Health Research (NIHR)(例外的な扱いとして申請可能)
  • Dunhill Medical Trust (DMT)(グラントの額によって使える額が違うが、オープンアクセス用の費用を別途申請可能)
  • Motor Neurone Disease Association
  • Parkinson's UK
  • Research Councils UK(Prepaid planを特定の大学に提供)
  • Telethon
  • UNU-WIDER
  • VSNU(特定のジャーナルのゴールドオープンアクセス費用をオランダの大学が払う)
  • Wellcome Trust
  • Worldwide Cancer Research(1本につき最大£2,000まで)

案外費用の一部でも負担してくれるところは多い。これは Elsevierに載ってるものを拾っただけなので、探せばもっとあるかも。グラント申請時にオープンアクセス費用を計上するようにというところもあるが、論文はいつ出るかわからないので、論文出した時に申請、というフレキシブルな運用の方がありがたい。

ビッチという言葉について

たまに思うのだが、「ビッチ」という言葉が不特定多数の男性と肉体関係を持つ女性、という意味で使われているが、これはすごく違和感がある。おそらく、bitchを日本語に言い換えると、「嫌な女」「クソババア」みたいな意味になると思う。

不特定多数の男性と寝る女は、よくSlutとか、もっときつい言葉だとWhoreとか言われる(体を売る女という意味でも使われるが、売春婦とはっきり言いたい時はprostituteと言い, whoreはどっちかというと罵り言葉の気がする)。

もちろん、bitchという時には、いろんな男と付き合う女という意味がある時もある。でもそれはあくまで「嫌な女」の一要素だ。だから、夫(やそれに近い人)が、浮気した妻をbitchと罵ることはできるかも(でも関係修復は遠ざかる)しれないが、それは「他の男と寝たこと=浮気したこと」が嫌な女の一要素になっているにすぎない。逆に、男性が女性に声をかけてつれなくされた時、男性が女性をbitchと罵って去っていくこともある。「自分の要求に応じない」というのが感じ悪い、嫌な女というわけだ。

とはいえbitchと呼ばれるのは有名税かもしれない。例えばだけれど、ベッキーのことをbitchと罵る人もいると思う。不倫したこと自体が問題というよりも不倫してしおらしく反省したように見せておいて、裏では関係継続なんて面の皮が厚いわ……という意味で、bitch感がある。まあ人の感じ方はそれぞれなので、一概には言えないのだが。
キム・カーダシアンはいわゆるプライベートビデオ流出事件とか、有名になるためにはなんでも利用するというイメージで女性にかなり嫌われていて、嫌な女・いかすけない女という意味でのbitchとして嫌われ女ランキング常連だ。
テイラー・スウィフトも、昔の彼氏をネタに歌を書き続けるところにbitch感があるという人もいる(元彼氏たちにしてみれば、ネタにされるのは嬉しいこととも限らないから)。
女性で嫌な感じがすると、なぜかbitchと呼ばれてしまうのは少しかわいそうでもある。この手のやることなすこといろいろにケチをつけられ悪口言われるポジションの男性というと、ジャスティン・ビーバーとか三代目J-soul brothersとかしか思いつかない。

面白いことに、bitchの嫌な女=女のくせに強い=自立してかっこいい、と一周回って良いイメージとして捉え、bitchと(半分自虐的でもありつつ)良い意味で使うこともある。この辺になるともうよくわからないのだが、呼びかけというか、別に意味を込めずにbitchと呼ぶこともある(が、使いどころが難しいので、使うのはおすすめしない)。

 例えばこの本。Skinny Bitchというタイトル。

スキニービッチ 世界最新最強!オーガニックダイエット

スキニービッチ 世界最新最強!オーガニックダイエット

  • 作者: ロリー・フリードマン,キム・バーノウィン,ウイアー美由紀
  • 出版社/メーカー: ディスカヴァー・トゥエンティワン
  • 発売日: 2008/07/15
  • メディア: 単行本(ソフトカバー)
  • 購入: 9人 クリック: 88回
  • この商品を含むブログ (24件) を見る
 

この本の内容はさておき……という感じ。

とはいえ、Bossy廃止運動(偉そうな女性のことをBossyという形容詞で呼んで萎縮させるのはやめようという運動)もあることだし、もしかしたらbitchという言葉も男女平等的な観点から死語と化す可能性もあると思う。単なる言葉狩りと思う人もいるかもしれないが、言葉のパワーは強い。

翻って、日本のビッチという言葉の意味はどこから来たんだろうか。何か有名な漫画か何かで使われたのがはしりなのか。とてもきになる。

ちなみにbitchは男性に向かって使うこともできる。弱々しいとか、偉い人にヘコヘコしたりするやつがいたらbitchな感じがする。イメージとしては、秘密警察みたいに偉い人のためにコソコソ嗅ぎ回ってるやつがいたら、そいつは「政府のbitch」という感じ。 

ビックデータが「データ(による)大量破壊兵器」になるとき - Cathy O'Neil「Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy」

Harvard Business Reviewの、新刊本著者のインタビューポッドキャストを聞き流す中、これはと思った本があって読んでみたのだが、ものすごく面白かった。

Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy by Cathy O'Neil

Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy

Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy

 

著者のCathy O'Neilはもともと数学研究者で、大学でテニュアトラックまで取っていたのだが、産業界へ移りヘッジファンドで働き始めたところ、サブプライムローン問題からの一連の金融危機を経験した。彼女は数学が大好きで、「数学は絶対に裏切らないもの」だと思っていたのだが、サブプライムローン破綻やその後のローンの支払いに困る人々を見て、実は数学や統計モデルによって誤った結論に導かれたり、モデルの誤りを修正することの困難さに思い至るようになる。それでブログを書き始め、今回本を出版するなど、ある種の啓発活動にも務めているようだ。

この本は統計モデルというよりも、社会問題やデータサイエンスの倫理学を扱った本だと思ってもらえるといいと思う。本の中では、(良かれと思って)種々の統計モデル*1を使い、人々が誤った結論に導かれたり、不公平性や困難を生じさせた例が紹介されている。ちらっとベイジアンや自然言語処理といった単語はでてくるが、計算の詳しい話は出てこない。またすべての統計モデルについて批判的であるというわけでもなく、危険な統計モデルを条件を挙げて解説している。

彼女が指摘しているのは、この種の統計モデル(Weapons of Math Destruction, WMD. 『データ(による)大量破壊兵器』。もちろんmassとmathをかけている)によって困難な状況に追いやられるのは、貧しかったり、すでに問題を抱えた人たちであるということだ。例えば、従業員の候補を評価するようなモデルを作るとする。モデルが使う入力のうち、ローンの支払いの遅延情報を入れたとすると、すでにローンの支払いに困難を生じている人が職を得ることが難しくなり、ますます支払いに困難が生じる、といった具合だ。このように、いわば統計モデルを用いた種々の評価システムが、困難な状況にある人をさらに「罰して」しまう状況に、著者は警鐘を鳴らしている。

WMDは不透明で、規模が大きく、害を被る人がいる、という定義である。そしてWMDによる判定は、覆したり、反論するのが難しい。例えば警察による犯罪予想マップは、貧しい人が住む地域を重点的に狙い撃ちしてしまう。その結果、軽微な犯罪が見つかり、予想マップはますますその地域を狙い撃ちにするようになる……という具合だ。

データを用いて何かを予測したり、評価システムを作る場合、効率か倫理か」の間のトレードオフがあるという点に筆者は言及している。例えば、良さそうな従業員候補をスクリーニングするのに、クレジットカードの遅延情報を用いるのは適切だろうか?きっとルーズな候補者は面接に呼ばずに済むだろう。でも、一旦カードの支払いが遅れてしまえば、職を得るチャンスも失い、その人はますます困窮する。

また、統計モデルの正しさをどうやって担保するか、モデルの良さを評価するための評価関数を選ぶ時に恣意性が入るのではないか、また実は入力データを作る時の不正を促進してしまう(カンニングなど)、などの問題点も具体例を交えて指摘されている。

最近流行り?のディープラーニングは、予測に用いる特徴抽出までやってくれるのだから、「何かを予測する」という目的達成のためなら非常に強力なツールだし、ある意味評価システムとして公平ではないかと思うかもしれない。特徴抽出を自動でやれば、おそらく効率最大化=倫理的配慮の無視、という流れになるだろうというのは、本書を読んでみればすぐ想像できる。現実世界の事象を全て数値化し、より良い予測を目指そうというのは、現実問題として(少なくとも今は)難しいのではないかと思う。特に感性・感情など計測しづらいものはデータ自体が作りづらい。行動データから間接的に測る方法もあるが、ここで問題になるのは、結果の解釈をする人間が持つバイアスだろう。なかなか一筋縄ではいかない。

また、彼女の「モデル」の話は、統計モデルにとどまらない。人種差別も、個人の世界の内部モデルのチューニング不足ではないかと指摘する。そして、人種差別的な傾向を持つ人々から取られたデータがモデルに入力され……というように、WMDの原因の一つになったりもするのだ。

彼女がここまでこだわるのは、金融危機の一翼を担ってしまった責任感や、数字の裏に人の生活あり、というのを感じたことにあるようだ。もともと曖昧性や不完全さを嫌って数学の世界に飛び込んだ彼女が、数学や統計モデルを現実世界に適用することの難しさを語るのは説得力がある。

 

では、どのような配慮をして、統計・予測モデルを運用するべきなのか?その点は難しい問題であるが、「効率と倫理」は相反するものであり、効率だけを追求するのではなく、倫理的な観点からモデルの良し悪しを検討すること、さらにフィードバックを含めた正しい評価システムを作ったり、問題を抱える人を発見した時に手助けする方向に進むべき、というのが彼女の主張だ。

 

この本はものすごく面白い。比較的短く、平易な文章で書かれている(単語が難しいかもと心配な場合は、Kindleで読むといい。最近は洋書のKindle版もすぐ手に入るようになり、本当に便利になったと思う)。巻末の註や出典情報も充実している(オンラインリンクなどはアーカイブ性が心配だが)。ラリー・サマーズが出てきたり、「優れたコーダーは日本の漫画サイトで時間を使うことが多い」とかいうビックデータ絡みの小噺もいろいろ載っていて面白い。

また、私自身は人の個性や性格を予測するような研究をやっているので、身につまされるところもあった。私自身がWMDを開発することはないだろうと思うのだが、自分の研究が誰かの予測モデルの正当化に使われるかもしれない。ただ、心理学者としては、本当は計れない「意識」とか「内部モデル(個々人が持っている世界に関する様々な仮定や知識 - 例えば「11月の東京は晴れやすい」「アメリカ人は明るい人が多い」など)」など、そういうものを定量化したいという欲求がある。これは様々な統計モデルが目指す目的と一部被っていて、実験や解析時に様々な観点から検討しないと思わぬ落とし穴にはまるのかもしれないと思う(Dr. Satoshi Kanazawaの件も有名)。研究者としては、彼女の投げかけた問いに真摯に対応しなければならないと思う。

翻訳を待つと遅いので、すぐに読んでもらいたいくらいだ。読みきれるか心配で買うかどうか迷ってる人は、著者のブログの他、Harvard Business Reviewの著者インタビューを見て話がわかりそうか判断してみるといいかもしれない。

hbr.org

出版社の方は1日も早い翻訳を。素人の意見だが、昨今のビックデータや人工知能の流れに乗って絶対売れると思う。

 

11/11/2016  追記

アメリカの選挙を受けて、ドナルド・トランプが大統領に選ばれる見通しになった。実はこの本には、パーソナライズド広告(属性によって広告の種類や内容)が、選挙や各種キャンペーンで用いられているということが指摘されている。

diamond.jp

トランプ候補はなぜ大統領選に勝ったのか: 極東ブログ

トランプ候補はこの辺りの広告戦略をかなりうまく(そして、ある意味こっそりと)やったのではないかと推測できる。つまり、本書が指摘する通り、あなたの隣人の見ているもの(広告)は、あなたの見ているものと全く違うかもしれないのだ。それが他者理解を阻んでいたり、社会の断絶を一層加速させているかもしれない。

*1:Math, と言ってはいるが、統計モデルとか、ビックデータ解析くらいの意味だと思っていた方がイメージに近い。イギリスにいるときも思ったのだが、Mathは数学ではなく、数字や統計を扱ったものという雰囲気で使われる場面が多かった。私の周りに理論系の研究者がいなかったせいもあるかもしれないが。