Lazy loaded image
🎵歌词网页动画
Words 681Read Time 2 min
2025-8-20
2025-8-20
type
summary
status
category
tags
slug
date
password
icon
CONTENT
 

Step1:灵感汲取,信息搜集

  1. 引子:【开源】world.execute(me); 以HTML呈现_哔哩哔哩_bilibili
  1. 其它参考:

Step2:Learn:

 

难点

  1. 歌曲文件的托管
  1. 审美风格:与歌曲主题的一致性,避免过多冗杂的动画效果
 
 
 

Step3:The Nights

 
 
 
 
 

Step4:打包抽离补充工作流

预工作流

  1. 喂给LLM代码
    1. 分析其中所有用到的动画效果,列出表格,总结效果名称和实现方式,以自然语言的形式输出
  1. 进一步分析
    1. 动画效果与歌词意思的对应关系,列出表格,以自然语言形式输出
  1. 重制something just like this歌词。目的:提取出一份txt文本,包含时间轴和文字,文字部分除了歌词,还包含一些重音节奏和变化,以注释形式。
  1. 将歌曲文件云端托管,得到可播放外链
  1. 喂歌词给LLM,要求根据2的对应关系,列出表格,设计相应歌词对应的动画效果,以自然语言形式输出
  1. 喂歌曲文件链接给LLM,要求按照5的设计给出代码
 
 
 
 
 
 
 

Gemini实现

 
 
 
 
 
 
 
换曲,多模态模型无法识别过长的音乐信息,上下文窗口一般支持最多3mim。退而求其次了,多模态无法识别并输出可靠的音频信息,即只有“[时间戳]歌词(注释)”的格式被遵循,内容与实际不符,幻觉严重。改为精校歌词,不含情绪和乐声描述。
 
 
 
 
 
 


杂项归档记录

图书馆快闭馆了,没来得及记录中间。也是,往后推进的优先级肯定比记录要高一些,不能因小失大
结果太牛逼了,好像掌握了一些技巧,当something just like this的歌词弹出,特别是底下的动画同步渲染的丝滑效果时,太爽了,真能成。
下面是阶段成果:需要下载到本地放进同一文件夹,后期可以把音乐文件托管,有链接即可
 
明天试试按同样的步骤优化一下,然后开源,录视频,投稿;后期可以试试做成生成网站,即投稿歌词,生成网页
 

优化步骤

  1. 给出歌词,生成简易动画
  1. 给出示例网页源代码,提供动画参考
  1. (待做)丰富动画
  1. 音乐文件托管
  1. 录视频
  1. 开源代码
  1. 投稿B站
 
 

 

Cited

 
 
 
 
 
 
 
 
 
 

 
 
 
上一篇
ComfyUI
下一篇
B&G design