公開時のライセンスについて
モデルの公開ありがとうございます。
勘違いでしたら申し訳ございません。
llama2ライセンスのモデルの継続事前学習であれば、llama2ライセンスに記載があるように、「モデルの出力をllama系列以外のllmの学習に使用してはならない」というルールが適用されるかと思います。従って、今回の公開モデルもllama2ライセンスに従うと思います。今回、cc-by-sa-4.0ライセンスでの公開に到った過程について教えていただけますと幸いです。(例えば、他のllama2モデルでcc-by-sa-4.0ライセンスで公開されているなど)
今回の公開モデルもllama2ライセンスに従うと思います。
「LLAMA 2 Community License」はあくまでも「Llama 2」に対するライセンスであり、そのライセンス中における「Llama 2」の定義はライセンスの冒頭にあるように以下の通りです。
“Llama 2” means the foundational large language models and software and algorithms, including machine-learning model code, trained model weights, inference-enabling code, training-enabling code, fine-tuning enabling code and other elements of the foregoing distributed by Meta at ai.meta.com/resources/models-and-libraries/llama-downloads/.
LLAMA 2 Community Licenseの1.aと5.bにあるように、Llama 2をもとに派生作品を作った場合、その派生作品の所有者はその作成者となります。
また派生作品に対して、その所有者がライセンスを付与することを制限する条項は、2のAdditional Commercial Termsを除いてありません。
他のllama2モデルでcc-by-sa-4.0ライセンスで公開されている
CC BY-SA 4.0ではないですが、Llama 2の派生モデルで独自のライセンスを付与している事例には下記があります。
モデルの出力をllama系列以外のllmの学習に使用してはならない
これは1.b.vを指しているかと思いますが、ここでいう「Llama Materials」の定義は以下の通りです。
“Llama Materials” means, collectively, Meta’s proprietary Llama 2 and Documentation (and any portion thereof) made available under this Agreement.
KARAKURI LMは「Llama Materials」ではないと考えております。
ライセンスの条項 1-b に再配布に関する規定があり、今回 Llama Materials を使用して作成したモデルを公開する (= 再配布する ) 場合こちらの条項が適用される理解です。
1-b-i は再配布者、 1-b-ii は受領者に関する規定です。今回は 1-b-i の規定に従うこととなり、 モデル配布時に Llama2 ライセンスを含めることが必要です ( 「所有者がライセンスを付与することを制限する条項」 に相当します )。
b. Redistribution and Use.
i. If you distribute or make the Llama Materials, or any derivative works thereof, available to a third party, you shall provide a copy of this Agreement to such third party.
ii. If you receive Llama Materials, or any derivative works thereof, from a Licensee as part of an integrated end user product, then Section 2 of this Agreement will not apply to you.
「モデル配布時に Llama2 ライセンスを含める」場合、モデルの利用は最大でも Llama2 の許容範囲内となります。そのため、より利用範囲を絞る非商用等のライセンスとは併用できますが、逆に許容範囲を広げるライセンス、MIT や Apache 2.0 、今回の CC BY-SA 4.0 とは併用できないと思います。事例として挙げられている Orca や Beluga2 は非商用のライセンスです。
この点については、以前問い合わせたことがあるので下記 Issue をご参照ください。
License of Llama2 derivative model
https://github.com/facebookresearch/llama/issues/907
Models fine-tuned from Llama2 weights need the LLAMA 2 Community License.
New models trained from scratch using the Llama2 codebase also need the LLAMA 2 Community License.
The LLAMA 2 Community License does not allow derivative works to be re-licensed under permissive licenses like MIT or Apache 2.0 that were not written for AI systems.
If codebase is implemetend from scratch by referring Llama2 paper, it does not need to inherit license because paper itself is not included to the "Llama Materilas"
CALM2 や Stockmark のモデルは許容範囲の広い Apache 2.0 でライセンスされていますが、これは Llama Materials 、公開されているコードや重みを使わず自前のコードでスクラッチから学習しているためライセンスの制約を受けないためです。
ご指摘、参考情報等いただきまして、ありがとうございます。
本件、社内で議論しておりますが、法務とも確認いたしますので、少々お時間をいただけますと幸いです。
元々併記した意図としては、Llama2 のライセンスの許容範囲を拡げる意図はなく、むしろ制限をすることやLlama2から追加されている部分に関してのライセンスを記載するつもりで書いておりました。
このあたりも参考にしているのですが、ご指摘の内容を考えると、参考にしないほうがよかったかもしれません。。
https://huggingface.co/defog/sqlcoder-34b-alpha
最終的に法務や弁護士さんと相談して意図がはっきり伝わる形で修正したいと考えております。
至らぬ点があり、申し訳ありません。
回答確定しましたらご連絡いたします。
丁寧な回答ありがとうございます。せっかくのモデルなので、 Llama2 のライセンスが許容する範囲で、意図した利用形態で公開されることを願っています。
なお参考として挙げられていた SQL Coder は、コードと重みのライセンスを分けており実装は Apache 2.0 で改変可能、ただし公開した重みを使い追加学習した際は CC BY-SA 4.0 により同一ライセンスでの公開義務が発生するようにしています。これはコードを使用しスクラッチから学習する利用者には高い自由度を与える反面、重みを再利用する利用者には公開義務を課しコミュニティへの還元を求めていると解釈できると思います。
Llama2 はコード、重みいずれも LLAMA 2 Community License に従う必要がありますが、たとえば今回のモデルについて重みの方をより permissive にするといった際は参考になると思います (コードは Llama2 ライセンスに従い利用可能だが、重みは研究用途に限定する/公開を要求するなど)。
大変お待たせしまして申し訳ありませんでした。
SQL Coderの件もコメントありがとうございます。
諸々のやりとりを踏まえて法務、弁護士さんと議論し、以下の内容で確定いたしました。
Llama 2 is licensed under the LLAMA 2 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.
Subject to the license above, and except for commercial purposes, you are free to share and adapt KARAKURI LM, provided that you must, in a recognizable and appropriate manner, (i) state that you are using KARAKURI LM developed by KARAKURI Inc., when you publish or make available to third parties KARAKURI LM, its derivative works or modification, or any output or results of KARAKURI LM or its derivative works or modification, and (ii) indicate your contributions, if you modified any material of KARAKURI LM.If you plan to use KARAKURI LM for commercial purposes, please contact us beforehand. You are not authorized to use KARAKURI LM for commercial purposes unless we expressly grant you such rights.
If you have any questions regarding the interpretation of above terms, please also feel free to contact us.
この結論に至った経緯ですが、まず、@icoxfog417 さんのご指摘は適当であり、弊社の記述が明確になるように修正するべきという話になりました。
その上で、そもそもモデルの重みが著作物であるかどうかについては議論が別れている部分であり結論が出ていないことと、CCライセンスが著作権に関するライセンスであることから、CCライセンスを付与すること自体、曖昧な部分を残してしまうことになってしまうということでした。
そのため、CCライセンスを適用するのではなく、明確に弊社としてしてほしいことを書く形が良いのではないかということになり、上記のような形式になった次第です。
曖昧な記述のままリリースしてしまったこと、大変申し訳ございませんでした。
次のバージョンの開発も進んでおりますし、ライセンスを変更する場合は、しっかりと法務チェックを通した上でリリースして参ります。
ご指摘いただきまして、大変助かりました。
ありがとうございました。