TriLoRA: Integrating SVD for Advanced Style Personalization in Text-to-Image Generation

Feng, Chengcheng; He, Mu; Tian, Qiuyu; Yin, Haojie; Zhao, Xiaofang; Tang, Hongwei; Wei, Xingqiang

Computer Science > Computer Vision and Pattern Recognition

arXiv:2405.11236 (cs)

[Submitted on 18 May 2024 (v1), last revised 13 Jun 2024 (this version, v2)]

Title:TriLoRA: Integrating SVD for Advanced Style Personalization in Text-to-Image Generation

Authors:Chengcheng Feng, Mu He, Qiuyu Tian, Haojie Yin, Xiaofang Zhao, Hongwei Tang, Xingqiang Wei

View PDF HTML (experimental)

Abstract:As deep learning technology continues to advance, image generation models, especially models like Stable Diffusion, are finding increasingly widespread application in visual arts creation. However, these models often face challenges such as overfitting, lack of stability in generated results, and difficulties in accurately capturing the features desired by creators during the fine-tuning process. In response to these challenges, we propose an innovative method that integrates Singular Value Decomposition (SVD) into the Low-Rank Adaptation (LoRA) parameter update strategy, aimed at enhancing the fine-tuning efficiency and output quality of image generation models. By incorporating SVD within the LoRA framework, our method not only effectively reduces the risk of overfitting but also enhances the stability of model outputs, and captures subtle, creator-desired feature adjustments more accurately. We evaluated our method on multiple datasets, and the results show that, compared to traditional fine-tuning methods, our approach significantly improves the model's generalization ability and creative flexibility while maintaining the quality of generation. Moreover, this method maintains LoRA's excellent performance under resource-constrained conditions, allowing for significant improvements in image generation quality without sacrificing the original efficiency and resource advantages.

Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2405.11236 [cs.CV]
	(or arXiv:2405.11236v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2405.11236

Submission history

From: Chengcheng Feng [view email]
[v1] Sat, 18 May 2024 09:29:00 UTC (2,262 KB)
[v2] Thu, 13 Jun 2024 04:42:23 UTC (2,262 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:TriLoRA: Integrating SVD for Advanced Style Personalization in Text-to-Image Generation

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:TriLoRA: Integrating SVD for Advanced Style Personalization in Text-to-Image Generation

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators