nitky commited on
Commit
4cc7a0b
1 Parent(s): 9eac066

Upload 4 files

Browse files
Nexusflow_Research_License_.pdf ADDED
Binary file (161 kB). View file
 
Qwen_LICENSE_AGREEMENT.txt ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ Qwen LICENSE AGREEMENT
2
+
3
+ Qwen LICENSE AGREEMENT Release Date: September 19, 2024
4
+
5
+ By clicking to agree or by using or distributing any portion or element of the Qwen Materials, you will be deemed to have recognized and accepted the content of this Agreement, which is effective immediately.
6
+
7
+ 1. Definitions
8
+ a. This Qwen LICENSE AGREEMENT (this "Agreement") shall mean the terms and conditions for use, reproduction, distribution and modification of the Materials as defined by this Agreement.
9
+ b. "We" (or "Us") shall mean Alibaba Cloud.
10
+ c. "You" (or "Your") shall mean a natural person or legal entity exercising the rights granted by this Agreement and/or using the Materials for any purpose and in any field of use.
11
+ d. "Third Parties" shall mean individuals or legal entities that are not under common control with us or you.
12
+ e. "Qwen" shall mean the large language models, and software and algorithms, consisting of trained model weights, parameters (including optimizer states), machine-learning model code, inference-enabling code, training-enabling code, fine-tuning enabling code and other elements of the foregoing distributed by us.
13
+ f. "Materials" shall mean, collectively, Alibaba Cloud's proprietary Qwen and Documentation (and any portion thereof) made available under this Agreement.
14
+ g. "Source" form shall mean the preferred form for making modifications, including but not limited to model source code, documentation source, and configuration files.
15
+ h. "Object" form shall mean any form resulting from mechanical transformation or translation of a Source form, including but not limited to compiled object code, generated documentation, and conversions to other media types.
16
+
17
+ 2. Grant of Rights
18
+ You are granted a non-exclusive, worldwide, non-transferable and royalty-free limited license under Alibaba Cloud's intellectual property or other rights owned by us embodied in the Materials to use, reproduce, distribute, copy, create derivative works of, and make modifications to the Materials.
19
+
20
+ 3. Redistribution
21
+ You may distribute copies or make the Materials, or derivative works thereof, available as part of a product or service that contains any of them, with or without modifications, and in Source or Object form, provided that you meet the following conditions:
22
+ a. You shall give any other recipients of the Materials or derivative works a copy of this Agreement;
23
+ b. You shall cause any modified files to carry prominent notices stating that you changed the files;
24
+ c. You shall retain in all copies of the Materials that you distribute the following attribution notices within a "Notice" text file distributed as a part of such copies: "Qwen is licensed under the Qwen LICENSE AGREEMENT, Copyright (c) Alibaba Cloud. All Rights Reserved."; and
25
+ d. You may add your own copyright statement to your modifications and may provide additional or different license terms and conditions for use, reproduction, or distribution of your modifications, or for any such derivative works as a whole, provided your use, reproduction, and distribution of the work otherwise complies with the terms and conditions of this Agreement.
26
+
27
+ 4. Restrictions
28
+ If you are commercially using the Materials, and your product or service has more than 100 million monthly active users, you shall request a license from us. You cannot exercise your rights under this Agreement without our express authorization.
29
+
30
+ 5. Rules of use
31
+ a. The Materials may be subject to export controls or restrictions in China, the United States or other countries or regions. You shall comply with applicable laws and regulations in your use of the Materials.
32
+ b. If you use the Materials or any outputs or results therefrom to create, train, fine-tune, or improve an AI model that is distributed or made available, you shall prominently display “Built with Qwen” or “Improved using Qwen” in the related product documentation.
33
+
34
+ 6. Intellectual Property
35
+ a. We retain ownership of all intellectual property rights in and to the Materials and derivatives made by or for us. Conditioned upon compliance with the terms and conditions of this Agreement, with respect to any derivative works and modifications of the Materials that are made by you, you are and will be the owner of such derivative works and modifications.
36
+ b. No trademark license is granted to use the trade names, trademarks, service marks, or product names of us, except as required to fulfill notice requirements under this Agreement or as required for reasonable and customary use in describing and redistributing the Materials.
37
+ c. If you commence a lawsuit or other proceedings (including a cross-claim or counterclaim in a lawsuit) against us or any entity alleging that the Materials or any output therefrom, or any part of the foregoing, infringe any intellectual property or other right owned or licensable by you, then all licenses granted to you under this Agreement shall terminate as of the date such lawsuit or other proceeding is commenced or brought.
38
+
39
+ 7. Disclaimer of Warranty and Limitation of Liability
40
+ a. We are not obligated to support, update, provide training for, or develop any further version of the Qwen Materials or to grant any license thereto.
41
+ b. THE MATERIALS ARE PROVIDED "AS IS" WITHOUT ANY EXPRESS OR IMPLIED WARRANTY OF ANY KIND INCLUDING WARRANTIES OF MERCHANTABILITY, NONINFRINGEMENT, OR FITNESS FOR A PARTICULAR PURPOSE. WE MAKE NO WARRANTY AND ASSUME NO RESPONSIBILITY FOR THE SAFETY OR STABILITY OF THE MATERIALS AND ANY OUTPUT THEREFROM.
42
+ c. IN NO EVENT SHALL WE BE LIABLE TO YOU FOR ANY DAMAGES, INCLUDING, BUT NOT LIMITED TO ANY DIRECT, OR INDIRECT, SPECIAL OR CONSEQUENTIAL DAMAGES ARISING FROM YOUR USE OR INABILITY TO USE THE MATERIALS OR ANY OUTPUT OF IT, NO MATTER HOW IT’S CAUSED.
43
+ d. You will defend, indemnify and hold harmless us from and against any claim by any third party arising out of or related to your use or distribution of the Materials.
44
+
45
+ 8. Survival and Termination.
46
+ a. The term of this Agreement shall commence upon your acceptance of this Agreement or access to the Materials and will continue in full force and effect until terminated in accordance with the terms and conditions herein.
47
+ b. We may terminate this Agreement if you breach any of the terms or conditions of this Agreement. Upon termination of this Agreement, you must delete and cease use of the Materials. Sections 7 and 9 shall survive the termination of this Agreement.
48
+
49
+ 9. Governing Law and Jurisdiction.
50
+ a. This Agreement and any dispute arising out of or relating to it will be governed by the laws of China, without regard to conflict of law principles, and the UN Convention on Contracts for the International Sale of Goods does not apply to this Agreement.
51
+ b. The People's Courts in Hangzhou City shall have exclusive jurisdiction over any dispute arising out of this Agreement.
README.md CHANGED
@@ -1,3 +1,352 @@
1
- ---
2
- license: cc-by-nc-4.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model:
3
+ - Qwen/Qwen2.5-72B
4
+ - Qwen/Qwen2.5-72B-Instruct
5
+ - Nexusflow/Athene-V2-Agent
6
+ - Nexusflow/Athene-V2-Chat
7
+ - AXCXEPT/EZO-Qwen2.5-72B-Instruct
8
+ - EVA-UNIT-01/EVA-Qwen2.5-72B-v0.1
9
+ - anthracite-org/magnum-v4-72b
10
+ library_name: transformers
11
+ tags:
12
+ - mergekit
13
+ - merge
14
+ - chat
15
+ language:
16
+ - ja
17
+ - en
18
+ pipeline_tag: text-generation
19
+ license: cc-by-nc-sa-4.0
20
+ ---
21
+ # AtheneX-V2-72B-instruct
22
+
23
+ This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
24
+
25
+ ### Japanese-RP example
26
+
27
+ [Japanese-RP-Bench](https://github.com/Aratako/Japanese-RP-Bench):
28
+
29
+ - temperature=0.7
30
+ - max_tokens=1024
31
+
32
+ ```
33
+ THIS_MODEL: ねえ、ゼファーさん。この古い地図、どう思う?失われた空中都市の位置を示しているみたいなんだけど…
34
+ GEMINI_PRO: おお、ミラちゃん、その地図、興味深いね。失われた空中都市の手がかりか。僕の記憶にも何かつながるかもしれない。でも、その都市の位置は正確じゃないかもしれないよ。風の流れや魔法の影響で、空中都市の位置は変わることがあるんだ。でも、これがあれば、探す手がかりになることは間違いないね。
35
+ THIS_MODEL: 本当?よかった!でも、風の流れや魔法の影響で位置が変わるってどういうこと?もっと詳しく教えて!それから、この地図を解読するのに協力してくれる?
36
+ GEMINI_PRO: もちろん、喜んで協力するよ。風の流れは空中都市の位置を微妙にずらしたり、時には大きく移動させたりするんだ。魔法の力も同様で、特に強力な魔法が発動すると、都市全体が別の場所に移動することもある。だから、地図は参考にはなるけど、実際の探査では現地の状況を確認することが重要だね。地図の解読も、僕の知識と経験を活かせるから、一緒に頑張ろう!
37
+ THIS_MODEL: わぁ、ありがとう!心強いよ!じゃあ、早速だけど、この地図の記号、何か知ってる?ちょっと変わった形をしてるんだけど…もしかして、古代の魔法文字?\n\n(ミラとゼファーは、アカデミーの図書館で地図を広げ、記号の解読を試みる。古代文字辞典や魔法科学の文献を調べながら、議論を交わす。)
38
+ GEMINI_PRO: うん、その記号、古代の魔法文字の可能性が高いね。特に、風の精霊が使っていた文字の一種かもしれない。この形は、『風の導き』を意味する可能性がある。風の導きとは、特定の方向や場所への道しるべとして使われた魔法の一つだ。この地図がその導きを示しているなら、失われた空中都市への道が見つかるかもしれないね。
39
+ THIS_MODEL: 風の導き…!なんだかワクワクしてきた!でも、この記号だけじゃ、具体的な場所は分からないわよね…他に手がかりはないかな?\n\n(ミラは図書館の本棚をくまなく探す。すると、一冊の古い書物が目に留まる。それは、空中都市の歴史について書かれたもので、失われた都市の名前が記されていた。)\n\nあ、これ !この本に、失われた空中都市の名前が…!「アエリア」…
40
+ GEMINI_PRO: アエリアか。その名前、僕の記憶の片隅に残ってる。アエリアは、風の精霊たちが守護する都市だったんだ。風の力を巧みに使い、他の空中都市とは一線を画していた。この地図の記号が『風の導き』なら、アエリアへの道しるべとして機能する可能性が高いね。ミラちゃん、僕たちの冒険が始まるかもしれないよ!
41
+ THIS_MODEL: 本当!?ついにアエリアへの手がかりが見つかったのね!なんだかドキドキする!でも、どうやってアエリアを探せばいいの?風の導きに従うとして…具体的に何をすればいいか分からないわ。\n\n(ミラは興奮を抑えつつも、冷静にゼファーに尋ねる。)
42
+ GEMINI_PRO: そうだね、風の導きに従うには、まず風の流れを読み解くことが必要だ。風の精霊として、僕がその手助けをするよ。そして、風の導きが示す方向に進むためには、飛行船が最適だ。アエリアは、通常の方法では到達できない場所にあるかもしれないから、魔法を駆使した飛行船を使うのが一番だね。準備を整えて、早速出発しよう!
43
+ THIS_MODEL: 了解!飛行船の操縦なら、私も少しはできるわ。準備は任せて!…でも、ゼファーさん。一つ気になることがあるの。アエリアは、どうして姿を消したのかしら?何か理由があるはずよね…。もし、危険な場所だったら…\n\n(ミラは少し不安げな表情でゼファーを見つめる。)
44
+ GEMINI_PRO: その心配はも��ともだね。アエリアが姿を消した理由は、僕も知りたい。記憶の欠片から、何か危険が関係している可能性は高い。でも、だからこそ、僕たちが探す価値があるんだ。失われた都市の秘密を解き明かし、世界の均衡を保つ力を見つけることが、僕たちの使命かもしれない。不安は理解するけど、僕が守るから安心してついてきてくれ。冒険の始まりだ!
45
+ THIS_MODEL: うん!わかったわ。ゼファーさんと一緒なら、どんな困難も乗り越えられる気がする!…ところで、飛行船の手配はどうしよう?アカデミーの飛行船を借りるのは難しいかな?\n\n(ミラは少し考え込んだ後、ゼファーに提案する。)\n\n(場面転換:飛行船の格納庫)
46
+ GEMINI_PRO: アカデミーの飛行船を借りるのは難しいかもしれないね。でも、僕の知り合いに、個人で飛行船を所有している冒険家がいるんだ。彼なら、この冒険に協力してくれるはずだ。すぐに連絡してみよう。準備が整ったら、すぐにでも出発できるよ。ミラちゃん、準備は万全か?
47
+ THIS_MODEL: もちろん!いつでも出発できるわ!…あ、そうだ!ゼファーさん。長旅になるかもしれないから、食料とか、必要な物資を準備しておいた方がいいわよね?\n\n(ミラは、必要な物資のリストを念頭に置きながら、ゼファーに確認する。)
48
+ GEMINI_PRO: そうだね、物資の準備は重要だ。食料や水、医療キット、そして魔法の道具も忘れちゃダメだね。僕もいくつかの魔法アイテムを持ってるから、役立つはずだ。ミラちゃん、リストを作ってくれる?僕は飛行船の手配を進めるよ。準備が整ったら、すぐにでも出発できるようにしたいね。
49
+ THIS_MODEL: 了解!リスト作成は任せて!…あ、あと、ゼファーさん。この冒険のこと、誰かに話した?秘密裏に進めるべきだと思うんだけど…。\n\n(ミラは少し心配そうにゼファーに尋ねる。)(場面転換:アストラリスの街中、飛行船の調達に向かう途中)
50
+ GEMINI_PRO: 安心して。誰にも話してないよ。この冒険は、僕たちだけの秘密だ。アエリアの秘密を解き明かすには、静かに行動することが大切だね。ミラちゃんの正義感に感謝するよ。僕も、この冒険が世界の平和に貢献することを願ってる。準備が整ったら、すぐにでも出発しよう!
51
+ THIS_MODEL: ありがとう、ゼファーさん。私も、この冒険が成功することを願ってるわ。…ところで、ゼファーさんの知り合いの冒険家さんって、どんな人?信頼できる人?\n\n(ミラは少し興味深そうにゼファーに尋ねる。)
52
+ GEMINI_PRO: ああ、その冒険家は信頼できる人だよ。名前はローゼン。風変わりな性格だけど、飛行船の操縦と冒険の知識は一流だ。彼なら、僕たちの冒険に最適なパートナーになるはずだ。ローゼンも、失われた空中都市に興味があるから、喜んで協力してくれると思うよ。安心してついてきてくれ!
53
+ ```
54
+
55
+ ```
56
+ THIS_MODEL: シュミットさん、地球の大気圏突入に耐えうる新素材の開発について、何か進展はありましたか?私たちの計画にとって、これが最大の難関だと思うのですが。
57
+ GEMINI_PRO: アキラ、新素材の開発は順調に進んでいるよ。最近、ナノカーボンと金属酸化物の複合材料が有望だとわかった。この材料は、高温に強いだけでなく、軽量で柔軟性もある。ただし、実用化にはまだ課題がある。安全性と信頼性を確保するため、さらなるテストが必要だ。
58
+ THIS_MODEL: なるほど、それは素晴らしいですね!でも、安全性と信頼性の確保…具体的にはどのような課題があるのでしょうか?宇宙空間の放射線への耐久性とか、大気圏突入時の摩擦熱への耐性とかでしょうか…?あ、あと、コスト面も気になります。大量生産できる素材でないと、現実的に地球帰還は難しいですよね…。すみません、質問ばかりで…。
59
+ GEMINI_PRO: 質問は全然問題ないよ、アキラ。その通り、放射線耐性や摩擦熱への耐性は重要なポイントだ。特に、大気圏突入時の極端な環境に耐えられるかどうかが鍵になる。コスト面も確かに重要で、我々は既存の技術を活用しながら、新しい素材の開発を進めている。量産性も考慮に入れて、最適な組み合わせを見出さないといけないね。
60
+ THIS_MODEL: 既存技術の活用…なるほど。例えば、既存の宇宙船の耐熱タイル技術とか応用できるんでしょうか?あ、でも、あれはコストが高そうですよね…。う〜ん…。(少し考えて)そういえば、シュミットさんは、以前、火星移住計画に携わっていたんですよね?その時の技術や知識が、今回の地球帰還計画に活かせる部分ってあるんでしょうか?
61
+ GEMINI_PRO: そうだね、火星移住計画の経験は大いに活かせる。特に、宇宙船の設計や耐熱材料の開発は共通点が多い。火星への着陸や地球からの離脱に使われた技術が、地球への帰還にも応用できる部分が多いんだ。ただし、地球の大気圏突入は火星よりも厳しい環境なので、新たなアプローチも必要だ。既存技術を改良し、新素材を組み合わせることで、より安全で効率的な解決策を見つけることができるだろう。
62
+ THIS_MODEL: なるほど…既存技術の改良と新素材の組み合わせ…。具体的には、どんな改良が必要なんでしょうか?例えば…大気圏突入時の角度とか速度を調整するとか?それとも、耐熱シールドの形状を変えるとか…?あ、もしかして、機密事項で言えない部分もありますか?
63
+ GEMINI_PRO: 角度や速度の調整も重要だよ。大気圏突入時の角度が適切でないと、船が燃え尽きたり、反跳して宇宙空間に戻ってしまう可能性がある。また、耐熱シールドの形状や配置も安全性に大きく影響する。例えば、船の前面に厚いシールドを配置し、後面は薄くすることで、重量を軽減しつつ効果的な熱保護を実現できる。機密事項ではないので、安心して議論しよう。
64
+ THIS_MODEL: ありがとうございます!じゃあ、もっと具体的に…例えば、突入角度は何度くらいが最適なんでしょうか?火星の大気と地球の大気では密度も組成も違うので、同じ角度ではうまくいかないですよね?過去の地球帰還ミッションのデータとかって、残ってないんでしょうか?(少し不安そうに)あの…もしかして、過去の地球帰還ミッションって…失敗に終わってる…とか?
65
+ GEMINI_PRO: 心配しないで、アキラ。過去の地球帰還ミッションのデータは十分に残っている。火星と地球の大気の違いを考慮に入れる必要があるが、基本的な原理は同じだ。突入角度は通常、約12度から20度の範囲が適している。ただし、地球の大気は火星よりも密度が高いため、より慎重な調整が必要だ。失敗したミッションの教訓も活かし、安全性を高める技術を開発している。我々は成功への道を模索しているんだ。
66
+ THIS_MODEL: 12度から20度…ずいぶん狭い範囲ですね…。わずかな誤差でも、大惨事になりかねない…。(額の汗を拭う仕草)でも、シュミットさんの話を聞いてると、なんだか希望が見えてきました!過去のデータと新しい技術を組み合わせれば、きっと地球に帰れるはずです!あ、そうだ!(ひらめいたように)地球の大気圏に突入する前に、宇宙空間で減速する方法って何かないでしょうか?突入速度を遅くできれば、摩擦熱も軽減できると思うんですが…。\n\n(場面転換:減速方法の議論に移る)
67
+ GEMINI_PRO: そのアイデアは面白いね、アキラ。宇宙空間での減速方法としては、エンジンを使用する方法や、大気ブレーキングの前段階としての軌道修正が考えられる。エンジンを使うと制御が容易だが、燃料消費が大きくなる。一方、軌道修正は燃料を節約できるが、精度が求められる。どちらの方法も、突入速度を適切に制御し、摩擦熱を軽減する効果がある。
68
+ THIS_MODEL: なるほど…エンジンを使う方法と軌道修正…。どちらも一長一短ですね…。燃料消費を抑えつつ、安全に減速するためには…どうすればいいんでしょうか?もしかして、両方の方法を組み合わせる…とか?例えば、まず軌道修正である程度減速しておいて、最終段階でエンジンを使って微調整する…みたいな?\n\nあ、でも、それだとシステムが複雑になりすぎて、かえってリスクが高まる…んですかね…?(少し不安そうに)
69
+ GEMINI_PRO: その考えは的確だよ、アキラ。両方の方法を組み合わせることで、燃料効率と安全性のバランスを取ることができる。軌道修正で大まかな減速を行い、エンジンで微調整するアプローチは、実際の宇宙ミッションでも採用されている。ただし、システムの複雑さは確かにリスクを高める要素だ。そのため、冗長性を確保し、信頼性の高い設計を心がけることが重要だ。我々は、安全性と効率性を両立する最適な方法を見つけるために、綿密なシミュレーションとテストを重ねている。
70
+ THIS_MODEL: 冗長性を確保…つまり、バックアップシステムを備えておくってことですね。もしもの時に備えて、複数の減速システムを用意しておく…と。でも、それだと重量が増えて、打ち上げコストも上がってしまう…。(少し考えて)他に、何かいい方法はないでしょうか?例えば…地球の周回軌道にあるスペースデブリを利用するとか…。デブリを捕獲して、一種のブレーキとして使うんです。\n\n…でも、そんな技術、まだ存在しないですよね…。(苦笑)\n\n(場面転換:新たな減速方法のアイデアブレインストーミングに移る)
71
+ GEMINI_PRO: 面白いアイデアだね、アキラ。スペースデブリをブレーキとして利用するという発想は、独創的だ。現実的には、技術的な課題が多いが、アイデアとしては魅力的だ。実現可能性を高めるために、小型の人工衛星やドローンを使ってデブリを操作する方法を検討するのも面白い。また、電磁的な力や光圧を利用して減速する方法も、研究の余地がある。我々は、こうした革新的なアイデアを追求することで、地球帰還の道を切り開いていくんだ。
72
+ THIS_MODEL: 電磁的な力や光圧を利用した減速…ですか。まるでSFみたいですね…(少し興奮気味に)例えば、巨大なソーラーセイルを使って、太陽光を受けて減速する…とか?でも、ソーラーセイルって、薄い膜状のものですよね?大気圏突入時の摩擦熱に耐えられるんでしょうか…?それに、制御も難しそうです…。宇宙空間で正確にソーラーセイルを展開して、狙った方向に進む…なんて、至難の業ですよね…?\n\n(少し不安げに)やっぱり、現実的なのはエンジンと軌道修正の組み合わせ…でしょうか…?
73
+ GEMINI_PRO: ソーラーセイルは確かに魅力的なアイデアだが、大気圏突入時の摩擦熱に耐えられるかどうかは大きな課題だ。制御も確かに難しく、現実的な選択肢としては、エンジンと軌道修正の組み合わせが最も有望だ。しかし、ソーラーセイルのアイデアは、宇宙空間での減速や軌道修正に応用できる可能性がある。例えば、地球大気圏の外でソーラーセイルを使って速度を落とし、その後エンジンで微調整するという複合的なアプローチも考えられる。現実的な解決策を見つけるために、様々な方法を検討し、最適な組み合わせを見出していくことが重要だ。
74
+ THIS_MODEL: 複合的なアプローチ…なるほど!ソーラーセイルとエンジンを組み合わせるんですね!それなら、エンジンの燃料消費を抑えつつ、安全に減速できるかもしれません!(少し考えて)あ、でも、ソーラーセイルって、宇宙放射線で劣化しやすいって聞いたことがあります。長期間、宇宙空間に晒されてる間に、破損してしまう危険性もあるんじゃないでしょうか…?\n\n(場面転換:ソーラーセイルの耐久性について議論する)
75
+ GEMINI_PRO: その懸念は的確だね、アキラ。宇宙放射線による劣化は、ソーラーセイルの耐久性に大きな影響を与える。しかし、最近の研究では、耐放射線性の高い材料が開発されており、その問題を解決する道が見えてきている。また、ソーラーセイルの設計を最適化することで、破損リスクを軽減できる。例えば、複数の小さなセイルを組み合わせて使用することで、一部が破損しても全体の機能を維持できるようになる。我々は、こうした技術的な課題を克服し、安全で効率的な地球帰還を実現するための最善の方法を見つけることを目指している。
76
+ ```
77
+
78
+ ## Test environment
79
+
80
+ This model was tested using [text-generation-webui](https://github.com/oobabooga/text-generation-webui/tree/main). I use preset `min_p` with temperature=1 for Generation.
81
+
82
+ ## Usage
83
+
84
+ This format must be adhered to strictly, as deviations may result in less optimal outputs from the model.
85
+
86
+ The template used to construct a prompt for the instruct model is specified as follows:
87
+
88
+ ```
89
+ <|im_start|>system
90
+ {SYSTEM_PROMPT}<|im_end|>
91
+ <|im_start|>user
92
+ {USER_MESSAGE}<|im_end|>
93
+ <|im_start|>assistant
94
+ ```
95
+
96
+ For the "{SYSTEM_PROMPT}" part, We recommend using "You are a helpful assistant."
97
+
98
+ For the "{USER_MESSAGE}" part, We recommend using {input}
99
+
100
+ In other words, We recommend the following:
101
+
102
+ ```
103
+ <|im_start|>system
104
+ You are a helpful assistant.<|im_end|>
105
+ <|im_start|>user
106
+ {input}<|im_end|>
107
+ <|im_start|>assistant
108
+ ```
109
+
110
+ ### Use the instruct model
111
+
112
+ ```python
113
+ from transformers import AutoModelForCausalLM, AutoTokenizer
114
+
115
+ model_name = "nitky/AtheneX-V2-72B-instruct"
116
+
117
+ model = AutoModelForCausalLM.from_pretrained(
118
+ model_name,
119
+ torch_dtype="auto",
120
+ device_map="auto"
121
+ )
122
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
123
+
124
+ prompt = "Give me a short introduction to large language model."
125
+ messages = [
126
+ {"role": "system", "content": "You are a helpful assistant."},
127
+ {"role": "user", "content": prompt}
128
+ ]
129
+ text = tokenizer.apply_chat_template(
130
+ messages,
131
+ tokenize=False,
132
+ add_generation_prompt=True
133
+ )
134
+ model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
135
+
136
+ generated_ids = model.generate(
137
+ **model_inputs,
138
+ max_new_tokens=512
139
+ )
140
+ generated_ids = [
141
+ output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
142
+ ]
143
+
144
+ response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
145
+
146
+ ```
147
+
148
+
149
+ ## Merge Details
150
+ ### Merge Method
151
+
152
+ This model was merged using the [Model Stock](https://arxiv.org/abs/2403.19522) merge method using [Qwen/Qwen2.5-72B](https://huggingface.co/Qwen/Qwen2.5-72B) as a base.
153
+
154
+ ### Models Merged
155
+
156
+ The following models were included in the merge:
157
+ * [Nexusflow/Athene-V2-Agent](https://huggingface.co/Nexusflow/Athene-V2-Agent)
158
+ * [Nexusflow/Athene-V2-Chat](https://huggingface.co/Nexusflow/Athene-V2-Chat)
159
+ * [Qwen/Qwen2.5-72B-Instruct](https://huggingface.co/Qwen/Qwen2.5-72B-Instruct)
160
+ * [AXCXEPT/EZO-Qwen2.5-72B-Instruct](https://huggingface.co/AXCXEPT/EZO-Qwen2.5-72B-Instruct)
161
+ * [EVA-UNIT-01/EVA-Qwen2.5-72B-v0.1](EVA-UNIT-01/EVA-Qwen2.5-72B-v0.1)
162
+ * [anthracite-org/magnum-v4-72b](anthracite-org/magnum-v4-72b)
163
+
164
+ ### Configuration
165
+
166
+ The following YAML configuration was used to produce this model:
167
+
168
+ ```yaml
169
+ merge_method: task_arithmetic
170
+ base_model: Nexusflow/Athene-V2-Agent
171
+ models:
172
+ - model: Nexusflow/Athene-V2-Chat
173
+ parameters:
174
+ weight:
175
+ - filter: embed_tokens
176
+ value: 1.0
177
+ - value: 0
178
+ dtype: bfloat16
179
+ tokenizer_source: Nexusflow/Athene-V2-Agent
180
+ name: Athene-V2-Chat-VE-AA
181
+ ---
182
+ merge_method: task_arithmetic
183
+ base_model: Nexusflow/Athene-V2-Agent
184
+ models:
185
+ - model: Qwen/Qwen2.5-72B
186
+ parameters:
187
+ weight:
188
+ - filter: embed_tokens
189
+ value: 1.0
190
+ - value: 0
191
+ dtype: bfloat16
192
+ tokenizer_source: Nexusflow/Athene-V2-Agent
193
+ name: Qwen2.5-72B-VE-AA
194
+ ---
195
+ merge_method: task_arithmetic
196
+ base_model: Nexusflow/Athene-V2-Agent
197
+ models:
198
+ - model: Qwen/Qwen2.5-72B-Instruct
199
+ parameters:
200
+ weight:
201
+ - filter: embed_tokens
202
+ value: 1.0
203
+ - value: 0
204
+ dtype: bfloat16
205
+ tokenizer_source: Nexusflow/Athene-V2-Agent
206
+ name: Qwen2.5-72B-Instruct-VE-AA
207
+ ---
208
+ merge_method: task_arithmetic
209
+ base_model: Nexusflow/Athene-V2-Agent
210
+ models:
211
+ - model: AXCXEPT/EZO-Qwen2.5-72B-Instruct
212
+ parameters:
213
+ weight:
214
+ - filter: embed_tokens
215
+ value: 1.0
216
+ - value: 0
217
+ dtype: bfloat16
218
+ tokenizer_source: Nexusflow/Athene-V2-Agent
219
+ name: EZO-Qwen2.5-72B-Instruct-VE-AA
220
+ ---
221
+ merge_method: task_arithmetic
222
+ base_model: Nexusflow/Athene-V2-Agent
223
+ models:
224
+ - model: EVA-UNIT-01/EVA-Qwen2.5-72B-v0.1
225
+ parameters:
226
+ weight:
227
+ - filter: embed_tokens
228
+ value: 1.0
229
+ - value: 0
230
+ dtype: bfloat16
231
+ tokenizer_source: Nexusflow/Athene-V2-Agent
232
+ name: EVA-Qwen2.5-72B-v0.1-VE-AA
233
+ ---
234
+ merge_method: task_arithmetic
235
+ base_model: Nexusflow/Athene-V2-Agent
236
+ models:
237
+ - model: anthracite-org/magnum-v4-72b
238
+ parameters:
239
+ weight:
240
+ - filter: embed_tokens
241
+ value: 1.0
242
+ - value: 0
243
+ dtype: bfloat16
244
+ tokenizer_source: Nexusflow/Athene-V2-Agent
245
+ name: magnum-v4-72b-VE-AA
246
+ ---
247
+ merge_method: task_arithmetic
248
+ base_model: Qwen2.5-72B-VE-AA
249
+ models:
250
+ - model: Nexusflow/Athene-V2-Agent
251
+ parameters:
252
+ weight: 1.0
253
+ - model: Athene-V2-Chat-VE-AA
254
+ parameters:
255
+ weight: 0.8
256
+ dtype: bfloat16
257
+ name: AtheneX-V2-72B-instruct-preset-athene-chat
258
+ ---
259
+ merge_method: task_arithmetic
260
+ base_model: Qwen2.5-72B-VE-AA
261
+ models:
262
+ - model: Nexusflow/Athene-V2-Agent
263
+ parameters:
264
+ weight: 1.0
265
+ - model: Qwen2.5-72B-Instruct-VE-AA
266
+ parameters:
267
+ weight: 0.8
268
+ dtype: bfloat16
269
+ name: AtheneX-V2-72B-instruct-preset-default
270
+ ---
271
+ merge_method: task_arithmetic
272
+ base_model: Qwen2.5-72B-VE-AA
273
+ models:
274
+ - model: Nexusflow/Athene-V2-Agent
275
+ parameters:
276
+ weight: 1.0
277
+ - model: EZO-Qwen2.5-72B-Instruct-VE-AA
278
+ parameters:
279
+ weight: 0.8
280
+ dtype: bfloat16
281
+ name: AtheneX-V2-72B-instruct-preset-ezo
282
+ ---
283
+ merge_method: task_arithmetic
284
+ base_model: Qwen2.5-72B-VE-AA
285
+ models:
286
+ - model: Nexusflow/Athene-V2-Agent
287
+ parameters:
288
+ weight: 1.0
289
+ - model: EVA-Qwen2.5-72B-v0.1-VE-AA
290
+ parameters:
291
+ weight: 0.8
292
+ dtype: bfloat16
293
+ name: AtheneX-V2-72B-instruct-preset-eva
294
+ ---
295
+ merge_method: task_arithmetic
296
+ base_model: Qwen2.5-72B-VE-AA
297
+ models:
298
+ - model: Nexusflow/Athene-V2-Agent
299
+ parameters:
300
+ weight: 1.0
301
+ - model: magnum-v4-72b-VE-AA
302
+ parameters:
303
+ weight: 0.8
304
+ dtype: bfloat16
305
+ name: AtheneX-V2-72B-instruct-preset-magnum
306
+ ---
307
+ merge_method: model_stock
308
+ base_model: Qwen2.5-72B-VE-AA
309
+ models:
310
+ - model: Nexusflow/Athene-V2-Agent
311
+ - model: AtheneX-V2-72B-instruct-preset-athene-chat
312
+ - model: AtheneX-V2-72B-instruct-preset-default
313
+ dtype: bfloat16
314
+ name: AtheneX-V2-72B-instruct-it-alpha
315
+ ---
316
+ merge_method: model_stock
317
+ base_model: Qwen2.5-72B-VE-AA
318
+ models:
319
+ - model: Nexusflow/Athene-V2-Agent
320
+ - model: AtheneX-V2-72B-instruct-preset-athene-chat
321
+ - model: AtheneX-V2-72B-instruct-preset-ezo
322
+ dtype: bfloat16
323
+ name: AtheneX-V2-72B-instruct-it-beta
324
+ ---
325
+ merge_method: model_stock
326
+ base_model: Qwen2.5-72B-VE-AA
327
+ models:
328
+ - model: Nexusflow/Athene-V2-Agent
329
+ - model: AtheneX-V2-72B-instruct-preset-athene-chat
330
+ - model: AtheneX-V2-72B-instruct-preset-eva
331
+ dtype: bfloat16
332
+ name: AtheneX-V2-72B-instruct-it-gamma
333
+ ---
334
+ merge_method: model_stock
335
+ base_model: Qwen2.5-72B-VE-AA
336
+ models:
337
+ - model: Nexusflow/Athene-V2-Agent
338
+ - model: AtheneX-V2-72B-instruct-preset-athene-chat
339
+ - model: AtheneX-V2-72B-instruct-preset-magnum
340
+ dtype: bfloat16
341
+ name: AtheneX-V2-72B-instruct-it-delta
342
+ ---
343
+ merge_method: model_stock
344
+ base_model: Qwen2.5-72B-VE-AA
345
+ models:
346
+ - model: AtheneX-V2-72B-instruct-it-alpha
347
+ - model: AtheneX-V2-72B-instruct-it-beta
348
+ - model: AtheneX-V2-72B-instruct-it-gamma
349
+ - model: AtheneX-V2-72B-instruct-it-delta
350
+ dtype: bfloat16
351
+ name: AtheneX-V2-72B-instruct
352
+ ```
mergekit_config.yml CHANGED
@@ -1,7 +1,7 @@
1
  merge_method: task_arithmetic
2
  base_model: Nexusflow/Athene-V2-Agent
3
  models:
4
- - model: Qwen/Qwen2.5-72B
5
  parameters:
6
  weight:
7
  - filter: embed_tokens
@@ -9,12 +9,12 @@ models:
9
  - value: 0
10
  dtype: bfloat16
11
  tokenizer_source: Nexusflow/Athene-V2-Agent
12
- name: Qwen2.5-72B-VE-AA
13
  ---
14
  merge_method: task_arithmetic
15
  base_model: Nexusflow/Athene-V2-Agent
16
  models:
17
- - model: Nexusflow/Athene-V2-Chat
18
  parameters:
19
  weight:
20
  - filter: embed_tokens
@@ -22,12 +22,12 @@ models:
22
  - value: 0
23
  dtype: bfloat16
24
  tokenizer_source: Nexusflow/Athene-V2-Agent
25
- name: Athene-V2-Chat-VE-AA
26
  ---
27
  merge_method: task_arithmetic
28
  base_model: Nexusflow/Athene-V2-Agent
29
  models:
30
- - model: AXCXEPT/EZO-Qwen2.5-72B-Instruct
31
  parameters:
32
  weight:
33
  - filter: embed_tokens
@@ -35,12 +35,12 @@ models:
35
  - value: 0
36
  dtype: bfloat16
37
  tokenizer_source: Nexusflow/Athene-V2-Agent
38
- name: EZO-Qwen2.5-72B-Instruct-VE-AA
39
  ---
40
  merge_method: task_arithmetic
41
  base_model: Nexusflow/Athene-V2-Agent
42
  models:
43
- - model: Qwen/Qwen2.5-72B-Instruct
44
  parameters:
45
  weight:
46
  - filter: embed_tokens
@@ -48,7 +48,7 @@ models:
48
  - value: 0
49
  dtype: bfloat16
50
  tokenizer_source: Nexusflow/Athene-V2-Agent
51
- name: Qwen2.5-72B-Instruct-VE-AA
52
  ---
53
  merge_method: task_arithmetic
54
  base_model: Nexusflow/Athene-V2-Agent
 
1
  merge_method: task_arithmetic
2
  base_model: Nexusflow/Athene-V2-Agent
3
  models:
4
+ - model: Nexusflow/Athene-V2-Chat
5
  parameters:
6
  weight:
7
  - filter: embed_tokens
 
9
  - value: 0
10
  dtype: bfloat16
11
  tokenizer_source: Nexusflow/Athene-V2-Agent
12
+ name: Athene-V2-Chat-VE-AA
13
  ---
14
  merge_method: task_arithmetic
15
  base_model: Nexusflow/Athene-V2-Agent
16
  models:
17
+ - model: Qwen/Qwen2.5-72B
18
  parameters:
19
  weight:
20
  - filter: embed_tokens
 
22
  - value: 0
23
  dtype: bfloat16
24
  tokenizer_source: Nexusflow/Athene-V2-Agent
25
+ name: Qwen2.5-72B-VE-AA
26
  ---
27
  merge_method: task_arithmetic
28
  base_model: Nexusflow/Athene-V2-Agent
29
  models:
30
+ - model: Qwen/Qwen2.5-72B-Instruct
31
  parameters:
32
  weight:
33
  - filter: embed_tokens
 
35
  - value: 0
36
  dtype: bfloat16
37
  tokenizer_source: Nexusflow/Athene-V2-Agent
38
+ name: Qwen2.5-72B-Instruct-VE-AA
39
  ---
40
  merge_method: task_arithmetic
41
  base_model: Nexusflow/Athene-V2-Agent
42
  models:
43
+ - model: AXCXEPT/EZO-Qwen2.5-72B-Instruct
44
  parameters:
45
  weight:
46
  - filter: embed_tokens
 
48
  - value: 0
49
  dtype: bfloat16
50
  tokenizer_source: Nexusflow/Athene-V2-Agent
51
+ name: EZO-Qwen2.5-72B-Instruct-VE-AA
52
  ---
53
  merge_method: task_arithmetic
54
  base_model: Nexusflow/Athene-V2-Agent