hzglm:↑nebuchadnezzar:↑hzglm:↑大师,这样的能来一波吗?
在阴森恐怖血流成河的魔窟里,男囚们跪成一排,穿着尖头三厘米防水台十五厘米细高跟大腿靴的美艳女王两腿叉开站在一男囚面前,戴着黑手套的玉手扯着男囚的头,强行将他的脑袋扭向上方,迫使他仰视自己,另一只玉手中握着一把女式勃朗宁,冰冷的枪口捅入男囚的嘴巴里,微笑着准备枪毙男囚……
和之前的有点雷同了,过段时间再搞
大师,这个情景中,希望十五厘米细高跟上可以串着眼珠、丁丁、蛋蛋、舌头……
其实对于Imagen3这种扩散模型,这些描述还挺难的,有几个都是它的弱点:
1. 注意力稀释。多人在一个场景里,每个人的形状会被稀释,导致都变形,最直观的就是各个人的脸都会变丑。
2. 指定数值距离。因为是通过概率来理解的,基本都不会遵守,最直观的就是推理逻辑、数学不行,在这里就是什么高度它其实是无视的。
3. 精密器械。因为都是学了个大致形状,有些还没有对应上名称,在这里的话就是那支枪是没办法指定型号的。
4. 物体互动。就是要求什么插入什么里面,如果不是一个现实中固定发生的场景,基本都很难。这里就是放到嘴里,或者高跟穿刺什么的,都只能看运气,多抽卡。
剩下就是Imagen3固有的限制:
1. 不能有暴力、血腥词汇形容(但是可以绕着弯摆pose布景,比如轻拿轻放轻轻踩、暗红色液体)
2. 不能直接出现生殖器官的词语("penis"实测是无论如何不能出现的)