Lazy loaded image
项目开发
🖼️照片手办化应用
Words 352Read Time 1 min
2025-8-23
2026-1-13
type
summary
status
category
tags
slug
date
password
icon
状态
子标签
标签
日期
Jan 13, 2026 08:03 AM
CONTENT
 

打包一个应用

动漫人物照转手办风格照片

whiteboard

  1. 输入:
    1. 用户上传图片:大多数场景
    2. 无图,text2image
    3. 无提示词,random
 

步骤

  1. 扩图,由半身照扩为全身照
    1. bug1:比例失调
    2. bug2:元素不统一
  1. 抠图,将人物主体,主要元素抠出
  1. prompt模板优化:将输入的自然语言提示词依照预设prompt模板优化
  1. 出图:两种模型对比出图,qwen-image-edit;nano banana,flux kontext;
 
 

BUG合集

  1. 扩图比例失调,表现为下半身腿短。根源在于扩图时的比例失调,叠加了风格转变的因素
  1. 风格迁移失败:表现为
    1. 面容和细节模糊
    2. 很大一部分保持了原样,并没有改变风格,常见于nano
    3. 引申:去试试开源的稳定的经过验证的comfyui开源社区的解决方案
  1. 元素错乱:比如剑很短
 
有时间把图示例子附加上
 
 
 

知识付费

  1. 程序员老王:隔壁的程序员老王的个人空间-隔壁的程序员老王个人主页-哔哩哔哩视频
    1. LLM
    2. Python
    3. 网络安全
  1. 炮老师的小课堂:炮老师的小课堂的个人空间-炮老师的小课堂个人主页-哔哩哔哩视频
    1. comfyui
 
 
 
 
 
 

 
 
 
上一篇
(又中止)黑盒语音机器人适配器_Astrbot
下一篇
AI提示词上下文工程