Compressing Large Language Models using Low Rank and Low Precision Decomposition...

		throwaway888abc on Nov 19, 2024 \| parent \| context \| favorite \| on: Leaner LLMs could enable efficient local use on ph... Compressing Large Language Models using Low Rank and Low Precision Decomposition https://arxiv.org/abs/2405.18886