martes, 25 de marzo de 2025

Aplicación de estilos artísticos


¡Benvidos ao meu blog! Neste traballo exploraremos a capacidade da intelixencia artificial para transformar imaxes ao estilo de Dalí. Para iso imos poñer a proba diferentes modelos de xeración de imaxes, desde DALL-E  ata outras ferramentas.

O obxectivo é analizar como a IA pode interpretar e recrear o estilo surrealista de Dalí, observando as fortalezas e limitacións de cada modelo. 

Primeiro vouvos ensinar un cadro do artista Dalí, para ir orientándonos de como era a súa arte;


E agora a imaxe que ten que cambiar :






DALL-E:

é unha intelixencia artificial deseñada para xerar imaxes a partir de descricións textuais, pero non pode cargar imaxes para que as mellores ou non pode facer unha imaxe cun estilo diferente.

Por iso doulle un 0/10.



Stable Difussion:



Stable Diffusion é unha ferramenta de intelixencia artificial moi poderosa que pode xerar imaxes moi realistas e creativas a partir de texto. Porén, ten limitacións, e unha delas é a súa capacidade para imitar o estilo artístico dun artista específico como Salvador Dalí.

Ademais, Stable Diffusion está deseñado para xerar imaxes novas, non para replicar estilos existentes. Cando lle pides que xere unha imaxe ao estilo de Dalí, o que fai é intentar crear algo que se pareza, pero non será unha copia exacta.

Por iso voulle poñer un 4/10.



Krea Ai:




Os modelos de IA como Krea AI, aínda que son moi avanzados, están adestrados para xerar imaxes novas baseándose nos patróns e características que aprenderon dun conxunto de datos de adestramento. Cando lle proporcionas unha imaxe existente e lle pides que a "estilice" como Dalí, a IA non está deseñada para facer unha tradución directa e precisa do contido da túa imaxe ao estilo do artista. En vez diso, tenta aplicar elementos estilísticos que asocia con Dalí (como formas surrealistas, cores específicas, ou certos motivos visuais) á estrutura xeral da túa imaxe.

Neste caso non fixo como eu lle pedín xa que a imaxe que xerou non se parece en nada a inicial, por iso voulle dar un 4/10.


Letś Enhance e Ai Image Upscaler: son ferramentas moi útiles, pero o seu obxectivo principal é mellorar a calidade e resolución das imaxes, non alterar o seu estilo artístico de forma creativa. Aínda que ambas usan intelixencia artificial, o seu funcionamento e o seu adestramento están enfocados nunha tarefa diferente á de imitar o estilo dun artista como Salvador Dalí.   

E neste último caso foi como as demais estas intelixencias solo melloran a calidade das imaxes e non  o traballo de cambiar a imaxe nun estilo artístico diferente.

A este doulles un 3/10porque non é o seu fuerte e fan outras cousas ben.

As outras intelixencias xa non as probei xa que  non puiden inxerir unha imaxe de referencia para que a cambiasen.      



martes, 18 de marzo de 2025

Resolución de imaxes

 


Mellora de resolución de imaxes







Neste traballo vou comentar os distintos modelos de imaxes para cambiar a resolución da imaxe que se atopa  arriba.



DALL-E:  é unha intelixencia artificial deseñada para xerar imaxes a partir de descricións textuais, pero non pode aumentar a resolución de imaxes existentes. Para mellorar a calidade dunha imaxe, é mellor recorrer a software específico de escalado e restauración.A parte de todo esto recomendoume outros tipos de modelos como Topaz Gigapixel AI ou Waifu2x,para mellorar a nitidez ou os detalles sen alterar a imaxe orixinal.Solo que hai que pagar para utilizalas.


Para mín este modelo non cumpleu os requisitos que lle pedín así que voulle poñer un 2/10.




Stable Diffusion:


O modelo de creación de imaxes Stable Diffusion non pode mellorar a resolución das imaxes de forma directa. O que fai é cambiar a imaxe, modificando algúns detalles ou estilo, pero non logra aumentar a súa calidade ou definición de maneira significativa. Ao traballar cunha imaxe de baixa resolución, o modelo só pode adaptala ou xerar novas versións que manteñen a súa resolución orixinal ou a alteran lixeiramente.


Para mín neste modelo pareceume mellor xa que polo menos intentouno cambiar pero ainda así  non mellorou a súa resolución.Este doulle un 4.5/10.



MidJourneyFree: como modelo de IA, céntrase na xeración de imaxes a partir de descricións textuais. Aínda que pode crear imaxes de alta calidade, non ten a capacidade de aumentar a resolución de imaxes existentes de forma nativa. Isto débese a que Midjourney xera novas imaxes baseadas nos prompts proporcionados, en lugar de modificar imaxes existentes.

Para aumentar a resolución dunha imaxe xerada por Midjourney, pódense utilizar ferramentas externas de mellora de imaxe. 


Este modelo decepcionoume bastante, un pouco como DALL-E que non cumpriu o que lle pedín por iso doulle un 1/10



Leonardo AI: este modelo a pesar das súas capacidades de xeración de imaxes, presenta certas limitacións que é importante ter en conta. Unha das principais é a ausencia dunha función directa para aumentar a resolución das imaxes existentes. Isto significa que as imaxes xeradas ou cargadas manterán a súa resolución orixinal.
Ademais outros problemas que lle atopei a este modelo e que as imaxes que introducía non cargaban ben ou non deixaban poñelas para que as melloralas.

A verdade e que este para mín foi o peor modelo xa que ademais de non mellorar a imaxe deume dificultades para atopar o que eu quixera, por iso doulle un 0/10.



Krea.ai:





Krea AI distínguese polo seu intento de mellorar a resolución das imaxes, unha función que a diferencia doutros modelos. Aínda que en certas ocasións, como na imaxe que aparece arriba, non logrou aumentar a resolución desexada, é importante destacar que si cumpriu coa instrución principal que se lle deu.

 A ferramenta demostra unha capacidade de interpretación e execución de comandos que, aínda que non sempre é perfecta en canto á resolución, si resulta efectiva na consecución do obxectivo principal.

Por iso voulle dar un 6/10 polo menos esta intentou mellorar a resolución das imaxes e fixoseme fácil atopar ás indicacións para o aumento da resolución das imaxes.


Let's Enhance:




A verdade é que a ferramenta fixo o que lle pedín ;aumentou a resolución da imaxe que lle mandei. A imaxe quedou moito máis nítida e con máis detalles, e iso gustoume moito.

Pero non todo foi perfecto. Houbo un problema que me chamou a atención: a cara da persoa que saía na imaxe quedou un pouco deformada. Non sei se foi un erro da ferramenta ou se a imaxe orixinal xa tiña algún problema, pero o certo é que a cara non quedou ben. É unha pena, porque o resto da imaxe quedou moi ben.

Penso que Let's Enhance é unha ferramenta útil para aumentar a resolución das imaxes, pero hai que ter coidado con este tipo de problemas. Por iso doulle un 8/10.



E esta foi a miña experiencia sobre os distintos modelos de xeración de imaxes, algúns xa non che deixaban  poñer as imaxes xa que non tiñan esas funcións como:Firefly,Ideogram,Leonardo AI...etc.

Pero outras si que tiñan esas funcións como as dúas últimas que fixen pero con algúns defectos.






venres, 28 de febreiro de 2025

Modelos de xeración de imaxes

  • Clasificación dos Modelos



As imaxes que se presentan son exemplos de composicións xeneradas por intelixencia artificial, nas que se combina a realidade e a fantasía de maneira creativa.  

A análise das imaxes permite observar como distintas ferramentas de IA logran crear composicións visuais únicas, aínda que tamén presentan algúns erros ou inconsistencias que revelan as limitacións tecnolóxicas e artísticas destas ferramentas.

O prompt que lle pedín os distintos modelos foi que fixera unha imaxe na que aparecera sobre o avión centos de polos tocando instrumentos e que no fondo houbera nubes negras.



Primeira imaxe; 

  • Modelo do que o saquei: Adobe Firefly
  • Erros que lle atopo a imaxe:
    • Os polos están demasiado organizados en filas perfectas, o que non é natural.
    • Ademais non lle puxen que fora realista pero aquí parece que o avión é real.

  • Opinión sobre este modelo:Dentro do que cabe puxo o que lle pedín;Podría estar mellor pero aínda así a imaxe é aceptable. Ademais é un modelo fácil de utilizar e non tiven problemas cos créditos deste modelo. A este voulle dar un 6,5/10.




Segunda imaxe:

  • Modelo do que o saquei: MidJourney
  • Erros que lle atopo a imaxe: a verdade é que o modelo está moi ben non teño moito que criticar a este modelo pero algo que me pareceu raro foi o avión xa que ten un tamaño bastante pequeno ,pero é verdade que non lle puxen que tamaño tiña que ter o avión; polo demais está moi ben.

  • Opinión sobre este modelo: Igual que outro este foi un modelo que puden manexar fácil xa que che indicaba moi ben onde buscar as cousas,crear imaxes e ata ver outras imaxes de referencia. Falando da imaxe impresionoume bastante os detalles deste modelo como os detalles das nubes,dos polos e do avión. Para mín este foi un bo modelo por iso voulle dar un 9,5/10.


Terceira imaxe:

  • Modelo do que o saquei: Dalle-E
  • Erros que lle atopo a imaxe: Esta imaxe pareceume un pouco estraña;Primeiro fallo que lle atopo é que alguns polos están flotando sen abrir as súas ás, e  a outro que lle atopo é que o avión ten unhas gafas na parte frontal.

  • Opinión sobre este modelo:A mín este modelo pareceume bo,xa que en realidade os fallos que tivo non foron moi importantes xa que si lle dis os fallos que tivo arreglase moi fácil.Os detalles desta imaxe foron tamén bos pero son un pouco peores co modelo anterior,por iso voulle dar un 8/10.






Cuarta imaxe:

  • Modelo do que o saquei: Leonardo Ai
  • Erros que lle atopo a imaxe: Para mín esta imaxe non tivo tantos fallos pero un deles é que os animais que están arriba do avión non son polos se non gansos e ademais son moi grandes.Por último non están tocando instrumentos cousa que lle pedín que fixeran polo demais está ben.

  • Opinión sobre este modelo: Este modelo pareceume un dos peores recopilando os datos que lle dis pero foi un dos mellores facendo o fondo que eso é un punto a favor para puntuar sobre este modelo.


     Conclusión: A verdade esta experiencia probando os distintos medelos de xeración de imaxe pareceume boa xa que puden aprender máis sobre este tema da tecnoloxía; a verdade é que pareceronme moi bos todos os modelos pero destacaría Midjourney polos detalles da imaxe.




venres, 10 de xaneiro de 2025

A Evolución dos Grandes Modelos de Linguaxe



Os modelos de linguaxe de grande escala (LLMs) están a revolucionar a intelixencia artificial. Estes sistemas, capaces de comprender e xerar texto semellante ao humano, son adestrados con enormes cantidades de datos e utilizan redes neuronais avanzadas. Grazas a isto, poden realizar unha ampla variedade de tarefas, como traducir idiomas, responder a preguntas, crear contido creativo e incluso escribir código.

A evolución dos LLMs foi rápida. Pasaron de sistemas baseados en regras a modelos moito máis sofisticados que poden aprender de forma autónoma. A arquitectura do transformador, que permite ao modelo prestar atención a diferentes partes da entrada, foi un fito clave neste desenvolvemento. Ademais, técnicas como o aprendizaxe profundo e o aprendizaxe por reforzo están a permitir crear modelos cada vez máis complexos e capaces.

¿Que podemos esperar no futuro? Os LLMs seguirán mellorando, con un enfoque en:

  • Aumento dos datos de adestramento: Para mellorar a precisión e a capacidade dos modelos. Os modelos máis recentes se están adestrando con cantidades masivas de texto, o que lles permite captar nuances e complexidades do idioma humano.
  • Modelos máis eficientes: Que requiran menos recursos computacionais. Isto permitirá que os LLMs se poidan executar en dispositivos máis pequenos e económicos.
  • Capacidades multimodais: Que poidan procesar non só texto, senón tamén imaxes, audio e video. Isto abrirá novas posibilidades para a creación de contido e a interacción co usuario.
  • Mayor control sobre os resultados: Permitindo aos usuarios personalizar a saída dos modelos. Isto é especialmente importante para aplicacións como a xeración de texto creativo ou a creación de chatbots.


En resumo, os LLMs son unha tecnoloxía con un gran potencial que está transformando numerosos sectores. A medida que continúan desenvolvéndose, podemos esperar ver aplicacións aínda máis innovadoras e sorprendentes. Algúns exemplos inclúen a creación de asistentes virtuais máis intelixentes, a mellora da tradución automática e o desenvolvemento de ferramentas para a creación de contido.