M系镜像 - DELETED

白云

白云酱Claubey

DELETED

仅镜像

DELETED

2024-04-11 02:12

白云

白云酱Claubey

ERROR_title_not_found

仅镜像

Deleted

2024-04-11 02:12

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:49

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:49

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:49

An

anjisuan998

Re: 基于Qwen 1.8B的本地色情文本翻译器：开发进度和目前的问题

仅镜像

牛逼，支持！

2024-01-08 20:29

In

injustice1

Re: 基于Qwen 1.8B的本地色情文本翻译器：开发进度和目前的问题

仅镜像

我觉得一个翻译模型最重要也是唯一的衡量标准就是翻译质量，而不是模型小，小模型固然有便捷之处但是舍弃了翻译质量就是舍本逐末。
还有你给出的翻译效果展示连魅魔这个词都翻错了，明明提示词都强调了，下面是用gpt3.5模型在相同的prompt下的翻译效果

**system**:
给一段日文文本，翻译并输出相应的中文含义。"

示例输入："こんにちは、今日は元気ですか？"
输出结果："你好，你今天好吗？"

示例输入："レイプ"
输出结果："强奸"

示例输入："サキュバス"
输出结果："魅魔"

示例输入："ドM"
输出结果："抖m"

--------------------

**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。

--------------------

**assistant**:
示例输入："旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果："勇者在启程前被魅魔捉住，被关押在魔王城里，成为各种魅魔榨取的游戏。

为了确保勇者绝对无法逃脱，他被施加了诅咒，而且在移动中也时刻被魅魔拥抱。

另外，由于城堡中到处都有魅魔居住，勇者可能会以各种方式被榨取精力。"

temp和top_p都是随便设置的，模型也没有微调，那我是不是也可以说chatgpt的潜力很大呢

2024-01-08 22:32

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:49

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:49

Qf

qfly1234321

Re: 基于Qwen 1.8B的本地色情文本翻译器：开发进度和目前的问题

仅镜像

技术流牛逼！！

2024-01-09 01:21

人賤

人賤合一马可波罗

Re: 基于Qwen 1.8B的本地色情文本翻译器：开发进度和目前的问题

仅镜像

大佬加油啊！

2024-01-09 06:37

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:50

白云

白云酱Claubey

Deleted

仅镜像

Deleted

2024-05-25 17:50

In

injustice1

Re: Re: Re: 基于Qwen 1.8B的本地色情文本翻译器：开发进度和目前的问题

仅镜像

TBY423315：↑
injustice1：↑我觉得一个翻译模型最重要也是唯一的衡量标准就是翻译质量，而不是模型小，小模型固然有便捷之处但是舍弃了翻译质量就是舍本逐末。
还有你给出的翻译效果展示连魅魔这个词都翻错了，明明提示词都强调了，下面是用gpt3.5模型在相同的prompt下的翻译效果

**system**:
给一段日文文本，翻译并输出相应的中文含义。"

示例输入："こんにちは、今日は元気ですか？"
输出结果："你好，你今天好吗？"

示例输入："レイプ"
输出结果："强奸"

示例输入："サキュバス"
输出结果："魅魔"

示例输入："ドM"
输出结果："抖m"

--------------------

**user**:
旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。

--------------------

**assistant**:
示例输入："旅立ち前にサキュバスに捕らわれてしまった勇者が、
魔王城に監禁され様々なサキュバスに搾られるゲームです。

勇者は万が一にも脱出できないよう、呪いを掛けられているうえに、
移動中も常にサキュバスに抱きかかえられています。

また、城の中にはいたるところにサキュバスが住んでいるため、
様々な方法で精を搾られてしまうでしょう。"
输出结果："勇者在启程前被魅魔捉住，被关押在魔王城里，成为各种魅魔榨取的游戏。

为了确保勇者绝对无法逃脱，他被施加了诅咒，而且在移动中也时刻被魅魔拥抱。

另外，由于城堡中到处都有魅魔居住，勇者可能会以各种方式被榨取精力。"
temp和top_p都是随便设置的，模型也没有微调，那我是不是也可以说chatgpt的潜力很大呢
确实是很好的一个问题！谢谢关注！

其实这个项目还是处于一个娱乐性质为主，也是我本人第一次正经的去部署和微调一个中文大语言模型。哈哈。而且我个人对本地部署一个大模型有特别的热爱。这整个项目就是我冲的时候脑子和牛子热了一下想出来的。
实用性确实难说，不过这已经是20亿参数以内中文表现最好的模型了，GPT3.5的参数量毕竟在他的30倍以上，比肯定是比不了的。我其实就想给自己找一个玩大模型的机会。
而且说不定色色文本finetune完表现会有大提升呢？它的日文训练数据量很少，但是英文上它确实知道succubus是什么东西。我也是想着自己试着开发一个基于llm的应用，给以后做准备。

其实之前我GPT2就还想过拿来练这个翻译器，但是后来就觉得basemodel太差了，就放弃了。

另外色色数据集我觉得这个也是很重要的。我还有个想法是在pixiv上直接拿大量的日英中文去练basemodel，然后再经过uncensored 的instruction finetune。不过这种级别的学习信息可能只有全参数训练才能做到，如果只用Lora的话就必须用整理过的对话数据练。

另外还有一个很难受的一点是我手头只有一个3060 laptop的gpu才6G显存，等我玩小模型积累了经验，并且升级16gb或24gb显存的显卡在去拿7B甚至13B参数的练，效果一定会好很多。