Portada! Guía: tu propio ""chatGPT"" en local.

Deleted member 1043761 · 15 Diciembre 2024

Algunas detalles:
- La cantidad de parametros de un modelo no es necesariamente proporcional al tamaño del dataset.
- Los modelos de Ollama por defecto estan quantizados en 4Bits (un modelo de 7B de parametros debe usar unos 4 o 5Gb de VRAM), puedes usar los tags para otras especificaciones.
- En LLM, modelos de 7B quantizados en 4 bits son suficiente para uso general. Mas parametros son utiles cuando quieres hacer rentrenamiento o ajustarlos para tareas especificas.

t3b4n · 15 Diciembre 2024

cliobrando dijo:
Algunas detalles:
- La cantidad de parametros de un modelo no es necesariamente proporcional al tamaño del dataset.
- Los modelos de Ollama por defecto estan quantizados en 4Bits (un modelo de 7B de parametros debe usar unos 4 o 5Gb de VRAM), puedes usar los tags para otras especificaciones.
- En LLM, modelos de 7B quantizados en 4 bits son suficiente para uso general. Mas parametros son utiles cuando quieres hacer rentrenamiento o ajustarlos para tareas especificas.

Muchas gracias por la corrección!

Ejecutor_Hanzo · 16 Diciembre 2024

Tengo una 3090 que ni uso para jugar, y justo estoy usando harto las IA para programar, asi que voy a probar a esto y en una de esas dejo de pagar por chatgpt :zippy

Stormbringer · 16 Diciembre 2024

Oie pero que buen post, agradecido! Por ahora estaba trabajando solo con stability matrix, a ver si le doy una miradita. A ver como anda en una 2060 6GB mobile.

doncoyote · 16 Diciembre 2024

Excelente guia!
Creo que sería importante agregar algunas preguntas triviales para hacer el entendimiento más transversal:

¿Por qué montaría un "chatgpt" local si puedo consumir los distintos bots disponibles en linea?
¿Qué ventajas o desventajas puede ofrecerme más allá del desafío de armarlo localmente?

Carlos E. Flores · 16 Diciembre 2024

doncoyote dijo:
Excelente guia!
Creo que sería importante agregar algunas preguntas triviales para hacer el entendimiento más transversal:

¿Por qué montaría un "chatgpt" local si puedo consumir los distintos bots disponibles en linea?
¿Qué ventajas o desventajas puede ofrecerme más allá del desafío de armarlo localmente?

¿Tendrá la misma cantidad de respuestas erróneas que los otros?

Pregunto por que he estado probando harto tiempo las AI y aún no consigo que respondan bien en algunas tareas aún cuando les doy la respuesta en un segundo, tercer, cuarto y quizás cuántos intentos.

Por ejemplo, contar de una lista ciertos parámetros.

t3b4n · 17 Diciembre 2024

doncoyote dijo:
Excelente guia!
Creo que sería importante agregar algunas preguntas triviales para hacer el entendimiento más transversal:

¿Por qué montaría un "chatgpt" local si puedo consumir los distintos bots disponibles en linea?
¿Qué ventajas o desventajas puede ofrecerme más allá del desafío de armarlo localmente?

Ventajas:

Una de las ventajas es lo que comentó @Ejecutor_Hanzo: dejar de pagar por la versión de pago de alguno de esos servicios en línea.
Los que no son de pago generalmente tienen restricciones a la cantidad de peticiones que puedes hacer en cierto periodo de tiempo, así es que ahí tienes otra ventaja: no tienes restricciones a la cantidad de peticiones que puedes hacer.
Servicios como chatGPT o Claude cobran un valor más alto para sus modelos más avanzados, por lo que en la versión gratuita sólo podrás acceder a los modelos más básicos (que suelen tener desventaja en benchmarks, en comparación a los modelos más avanzados).
El servicio se puede configurar para funcionar off-line, en cuyo caso el modelo funcionará sólo con datos locales. Esta es una ventaja si estás interesado en la privacidad: tus datos/prompts no van a terminar en el servidor de terceros, no serán usados para entrenar otros modelos ni hay riesgo de data leaks.

Desventajas:

Tienes un costo inicial más alto. Si no tienes hardware disponible, necesitas comprar un PC con hardware que sea capaz de llevar a cabo esta tarea.
Va a subir la cuenta de la luz.
Los modelos open source carecen de funcionalidades avanzadas que se pueden encontrar en modelos cerrados/de pago, como por ejemplo la posibilidad de controlar acciones en el PC mediante instrucciones en lenguaje natural, algo que hace poco anunció Anthropic.

Carlos E. Flores dijo:
¿Tendrá la misma cantidad de respuestas erróneas que los otros?

Pregunto por que he estado probando harto tiempo las AI y aún no consigo que respondan bien en algunas tareas aún cuando les doy la respuesta en un segundo, tercer, cuarto y quizás cuántos intentos.

Por ejemplo, contar de una lista ciertos parámetros.

Cada modelo ha sido entrenado con distintos datos, así es que debes ir testeando diferentes modelos para ver cuál se ajusta más a tu uso. Otro punto que hará la diferencia es si se activa o no el acceso a internet para hacer consultas. Acá dejo un ejemplo de cómo distintos modelos dan diferentes respuestas a una misma consulta. o incluso el mismo modelo, cuando se le da o se le quita acceso a las búsquedas en internet.

Una forma de evitarse la paja de ir testeando modelo por modelo es buscar benchmarks en internet, como este: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard#/

Edit: actualizado con las desventajas.

Carlos E. Flores · 17 Diciembre 2024

Ya, pero para ese tipo de cosas cualquier buscador es más acertivo.

Hasta donde sé, estas AI son modeladores de lenguaje (o como se diga), por lo que en lo que es tareas diferentes como que aún no los han potenciado bien (salvo en multimedia) no se les puede pedir mucho.

Deleted member 1043761 · 17 Diciembre 2024

Opinion personal:
Creo que una de las principales ventajas de correr un modelo como ollama, codellama, etc. localmente en el pc tiene que ver con privacidad y compliance.
Por ejemplo con Langchain puedes crear un RAG (Retrieval Augmented Generation), le dices a ollama o llamacpp que se entrenen usando documentos que tengas almacenados en alguna parte, y asi puedes obterner respuestas desde la base de vectores que se genera.

No solamente pueden ser libros, pueden ser planillas de exel, PDF, etc. que seria una locura subirlos al ChatGPT o a otra parte (cosa que la gente hace actualmente). Con eso puedes pedirle que te haga el resumen del libro, o que te diga cuales fueron los resultados economicos de una planilla, y asi.

Si tienes un server en la casa puedes crear tu propio servidor de inferencias, y generar pipelines entre modelos. Ej que la salida de texto del ollama pase por un T2S y se convierta en audio.

t3b4n · 17 Diciembre 2024

Carlos E. Flores dijo:
Ya, pero para ese tipo de cosas cualquier buscador es más acertivo.

Hasta donde sé, estas AI son modeladores de lenguaje (o como se diga), por lo que en lo que es tareas diferentes como que aún no los han potenciado bien (salvo en multimedia) no se les puede pedir mucho.

"Contar de una lista de ciertos parámetros" también es algo que se puede hacer de otras formas, a mano, por ejemplo. ¿cuál es tu punto?

Te di un enlace a un benchmark donde puedes comprobar los modelos que tienen mejores resultados en tareas matemáticas, si ese es el uso que le quieres dar. Puedes descargar alguno y probar o buscar más documentación o reviews, si estás interesado en obtener más información al respecto.

senbe · 17 Diciembre 2024

Pregúntenle la edad de Oveja Negra, a ver si le achunta haha

Fuera de bromas. ¿Esto se puede implementar en un entorno educativo? Como ayudante de estudio.

t3b4n · 17 Diciembre 2024

senbe dijo:
Pregúntenle la edad de Oveja Negra, a ver si le achunta haha

Fuera de bromas. ¿Esto se puede implementar en un entorno educativo? Como ayudante de estudio.

mario2130 · 18 Diciembre 2024

Excelente aporte amigo. Sin duda el mejor aporte para mi es la privacidad, y la capacidad de pasarles promp enormes. Lo único penca que no tengo hw como dicen arriba y nica me correra en mi notebook

t3b4n · 18 Diciembre 2024

mario2130 dijo:
Excelente aporte amigo. Sin duda el mejor aporte para mi es la privacidad, y la capacidad de pasarles promp enormes. Lo único penca que no tengo hw como dicen arriba y nica me correra en mi notebook

Corre hasta en un raspberry pi, mientras tengas memoria suficiente.

Ejecutor_Hanzo · 20 Diciembre 2024

Como anda con programacion? a chatgpt le da amziedadm luego de 350 lineas de codigo php :zippy

PD: instale la sh1t asi que mas adelante en la semana les comento como me va programando con qwen2.5-coder.

Bafgandalf · 28 Diciembre 2024

Buen post.

Yo que aún no pruebo implementaciones de IA, encuentro interesantisimo el tema.
Viva la privacidad (y no pagar por el chaSGEPETE)

Saludos,

unreal4u · 28 Diciembre 2024

Buen tema!

Pta, yo hace caleta de tiempo que venía preparando un post de lo mismo, pero la verdad dp me puse a hacer otras cosas y como que anduve abandonando la idea xD

Ahora que the open home foundation sacó un nuevo producto (el micrófono propio) creo que esto volverá a ser relevante ya que me permitirá hacer una solución 100% local que entienda los problemas y que además me permita hacer respuestas más elaboradas.

En fin, es entretenido para jugar pero ChatGPT está mejor entrenado. En casi todos los escenarios ChatGPT siempre me daba una mejor respuesta mientras que el LLM local daba jugo con algunas cosas.

Saludos.

Ejecutor_Hanzo · 30 Diciembre 2024

He estado programando con qwen2.5-coder y la verdad me tiene bastante decepcionado. Es bueno haciendo sugerencias de solucion de codigo, pero es terrible haciendo analisis de codigo proporcionado y ni hablar cuando le das la orden de implementar la solucion en tu codigo base o que siga instrucciones precisas (por muy sencilla que sea la solucion) cosa que chatgpt, cuando no colapsa, lo hace brillantemente. Tambien hay que decir que la velocidad no es muy buena, no se si hay opciones para que la IA ocupe todos los recursos necesarios para que sus repuestas sean mas rapidas. (Ojo que tengo un intel i9 de 14, RTX 3090 y 64GB en RAM con NVME de 4ta gen)

Seguire jugando a ver si dando las instrucciones de cierta manera hace mejor el trabajo.

t3b4n · 30 Diciembre 2024

Ejecutor_Hanzo dijo:
He estado programando con qwen2.5-coder y la verdad me tiene bastante decepcionado. Es bueno haciendo sugerencias de solucion de codigo, pero es terrible haciendo analisis de codigo proporcionado y ni hablar cuando le das la orden de implementar la solucion en tu codigo base o que siga instrucciones precisas (por muy sencilla que sea la solucion) cosa que chatgpt, cuando no colapsa, lo hace brillantemente. Tambien hay que decir que la velocidad no es muy buena, no se si hay opciones para que la IA ocupe todos los recursos necesarios para que sus repuestas sean mas rapidas. (Ojo que tengo un intel i9 de 14, RTX 3090 y 64GB en RAM con NVME de 4ta gen)

Seguire jugando a ver si dando las instrucciones de cierta manera hace mejor el trabajo.

Yo también he estado usando Qwen 2.5 coder, en la versión de 32b y no he tenido problemas de rendimiento (Ryzen 9 7900, 32Gb ram, RTX3090). Tengo un nvme dedicado a los puros modelos, aunque no creo que eso pueda ser un factor que afecte el rendimiento, por el otro SSD tiene sólo el SO que no está haciendo mucho mientras yo ocupo ollama.

Ayer estuve dándole algunas instrucciones para código y en general funcionó re-bien. Tal vez depende del lenguaje con que se use? Yo al menos le pedí que me creara una función en Python y luego de un pimponeo definiendo bien los requerimientos hizo exactamente lo que necesitaba.

Portada! Guía: tu propio ""chatGPT"" en local.

Deleted member 1043761

Guest

t3b4n

Ocioso

Ejecutor_Hanzo

Closcapchon.

Stormbringer

Maestro Chasquilla

doncoyote

The ignored one

Carlos E. Flores

Zombie

t3b4n

Ocioso

Carlos E. Flores

Zombie

Deleted member 1043761

Guest

t3b4n

Ocioso

senbe

Asesino de ferrules.

t3b4n

Ocioso

mario2130

Miembro Regular

t3b4n

Ocioso

Ejecutor_Hanzo

Closcapchon.

Bafgandalf

I' am the Warchief!

unreal4u

I solve problems.

Ejecutor_Hanzo

Closcapchon.

t3b4n

Ocioso