Hola, soy perro tuerto. Mi formación académica es en Filosofía, mi profesión es en la edición de publicaciones (libros, fanzines, revistas…) y mi programación se enfoca en el desarrollo de metodologías libres para la publicación. Soy fan de las humanidades, la paleoantropología y las ciencias de la computación, así como soy voluntario en organizaciones sobre edición, software y cultura libres, como Programando LIBREros, Miau, Cuates o Wikipedia. Doy soporte técnico a la Academia Mexicana de la Lengua y puedo ayudarte en tus proyectos.
En este espacio comparto enlaces que me parecen chéveres.
20/01/202414/02/2024
Ejercicios de ajedrez interactivos
Checkmate Champ es una herramienta interactiva para practicar ajedrez. La fuente de sus ~800 ejercicios es 1001 Brilliant Ways to Checkmate (1955) de Fred Reinfeld.
Mi interés editorial en este enlace es porque muestra dos cuestiones:
Una manera en como una obra puede ser transportada a un contexto digital sin necesidad de ser un PDF o un libro electrónico, sino una experiencia más ad-hoc a lo que es posible hacer en este contexto tecnológico.
Una muestra de lo que una publicación podría ser si su soporte es tanto un lenguaje de marcado como un lenguaje de programación. Me imagino una plataforma de lectura (lector) que sea más cercana a la experiencia de la computación interactiva que de la metáfora de la página impresa.
Un ejemplo de un lector así sería una nueva edición del libro de Fred Reinfeld que siga la estructura de la obra original, pero cada uno de sus ejercicios, en lugar de ser una imagen, es un contenido interactivo como los de Checkmate Champ. Otros ejemplos serían libros de ciencias donde las fórmulas o ejercicios se ejecuten paso a paso (cuya ventaja adicional es la verificación del contenido para evitar erratas).
Para libros de humanidades y de otra índole, esta experiencia podría ofrecer otros usos o maneras de leer. Por ejemplo, varias obras que leo están en diferentes ediciones y lenguas con distinto grado de cuidado editorial; si tuviese todas estas ediciones en una lectura interactiva, podría cotejar oraciones o párrafos en sus distintas ediciones. En libros infantiles se podría tener experiencias semejantes a los de un appbook pero sin el problema de tener que desarrollar una aplicación multiplataforma (ni tener que lidiar con las tiendas de Google y Apple para su aprobación). Para los libros que se gestionan con un gestor de versiones o que tienen una historia de su escritura, estos podrían «reproducirse» de manera cronológica para su lectura.
20/01/202411/02/2024
Libros digitales de Alas y Raíces, el programa de la Coordinación Nacional de Desarrollo Cultural Infantil
Desde sus orígenes, el programa Alas y Raíces ha propuesto distintos caminos para transformar el trabajo cultural con niñas, niños y adolescentes. Su librero digital es un fondo para un público infantil.
Su sitio es vistoso, pero requiere optimizaciones en su diseño para móviles y en el tamaño de sus imágenes, así como requiere de alguna interfaz que permita consultar el fondo en su totalidad (p. ej., no hay manera de saber qué tan grande es su acervo, al menos que cuentes las publicaciones de cada una sus secciones). No obstante, es un buen recurso para quienes estén interesados en literatura infantil.
19/01/202411/02/2024
La Biblioteca Digital custodia los libros que han servido de apoyo a esta institución en sus trabajos desde hace 3 siglos
La Biblioteca Digital de la Real Academia Española (RAE) custodia los libros que han servido de apoyo a esta institución en sus trabajos desde hace 3 siglos.
Entre los fondos patrimoniales de la RAE, figura la colección de más de 600 manuscritos, 42 incunables y primeras ediciones de obras de los principales escritores españoles, ~1,000 comedias sueltas que reflejan la evolución del teatro español, 1,176 títulos de publicaciones periódicas reunidas desde el siglo XVIII hasta la actualidad, 4,381 sermones sueltos de los siglos XVI al XX, entre más obras especializadas a partir del siglo XVI.
El fondo de la biblioteca digital tiene disponible la mayoría de estas obras (~5,200). Además de su valor histórico y académico, me resulta interesante que usen Internet Archive BookReader (IABR) para la vista en línea de sus libros.
Por un lado, IABR ofrece una experiencia de usuario homologada y especializada en fondos digitalizados. Por el otro, me hace pensar en la conveniencia de no solo usar IABR para un fondo de obras digitalizadas, sino también aprovechar la infraestructura de Internet Archive para hospedar las obras (aunque manteniendo un respaldo en otro lado por si las dudas). Con esta delegación, la infraestructura de una biblioteca digital puede ser minimalista.
La estructura minimalista prescindiría de un servidor. En su lugar, sería un conjunto de páginas estáticas generadas con Jekyll, Hugo o Pelican. Las personas que desarrollan la biblioteca trabajarían con Git y harían uso de CI/CD de GitLab o GitHub para la producción automatizada del sitio cada vez que se haga un cambio. Esto también permitiría tener el sitio como una página de GitLab o GitHub, por lo que no sería necesario contar con un dominio para que la biblioteca esté disponible en internet. Aunque si se cuenta un dominio, este puede gestionarse a través del panel de administración de estas plataformas para Git.
El trade-off es que esta infraestructura minimalista carecería de la capacidad para gestionar usuarios. Pero esta limitación no es por el hospedaje de los libros en Internet Archive, sino por la omisión del uso de un servidor.
02/01/202414/02/2024
Libros electrónicos de alta calidad en inglés
Standard Ebooks es un proyecto voluntario que hace nuevas ediciones de obras en inglés bajo dominio público con un cuidado en su formato, con licencia de código abierto y disponibles de manera gratuita y sin DRM.
Otros proyectos de libros digitales, como el Proyecto Gutenberg, transcriben obras y las liberan para llegar al mayor número de lectores digitales posibles. Standard Ebooks toma libros de estas bibliotecas, les da formato y las compone tipográficamente con un cuidado editorial profesional que incluye lecturas de pruebas, correcciones y testing.
Standard Ebooks no es solo un bello recurso para tu biblioteca digital: también es un estándar de calidad para producir tus propios libros.
Sus enlaces de interés son los siguientes:
Estantería con ~1,000 libros.
Manual de estilo muy meticuloso, con un diseño agradable y escrito con reStructuredText.
Descargador en pila para obtener libros por tema, colección, autor o mes.
Agregadores de contenido en formato OPDS, Atom o RSS.
Repositorios donde está disponible el código de su sitio, manual y la herramienta CLI, escrita en Python, para la producción de libros según sus criterios editoriales.
En América Latina existe una entidad editorial que es un proyecto comunitario similar pero más antiguo, con más voluntarios y con un catálogo mucho más amplio (~63,000 obras en ~12 años). Esta entidad, a lo que sé, es la que más libros electrónicos publica al año en la región, muchos más que cualquier editorial conocida. Sin embargo, lo que me llama la atención de Standard Ebooks son dos cosas:
Desarrollan y mantienen una y solo una herramienta para la producción de las publicaciones según sus criterios editoriales.
Son una organización sin fines de lucro, lo cual les permite obtener financiamiento para su proyecto.
Me pregunto si es posible un proyecto similar para obras en español bajo dominio público o en acceso abierto. ¿Podría un proyecto así sostenerse?
31/07/202314/02/2024
Una biblioteca que ofrece acceso a publicaciones en dominio público, en inglés, español y otros idiomas
HathiTrust es un diverso colectivo de bibliotecas académicas y de investigación que están alrededor del mundo. Su biblioteca digital preserva los registros públicos en pos de un acceso legal y a largo plazo, los cuales son gestionados en asociación con las instituciones académicas que apoyan su trabajo.
HathiTrust se fundó en 2008 como una organización sin fines de lucro de bibliotecas académicas y de investigación que hoy en día preservan más de 18 millones de ítems digitalizados y disponibles en la biblioteca digital HathiTrust. Ofrece acceso a los materiales de manera más amplia posible según las leyes del derecho de autor internacionales y de EE. UU., así como ofrece herramientas para la minería de textos y de datos, además de otros servicios emergentes.
El liderazgo viene de todas las esquinas de las bibliotecas que forman parte de la organización. Del consejo directorio, que ayuda en la visualización de las posibilidades de HathiTrust, a los miembros del comité de dirección, quienes apoyan en la estrategia del día a día, la gobernanza y liderazgo de HathiTrust se extiende a partir de las personas miembro que están comprometidas con las actividades académicas contemporáneas, las necesidades de la educación superior y el panorama informativo en general.
Biblioteca digital HathiTrust. La biblioteca es el hogar de millones de libros y publicaciones. De manera digilente y junto con instituciones de investigació, el personal preserva y crece esta colección mientras provee de acceso legal a los usuarios alrededor del mundo.
Servicio de solicitud de textos accesibles. Las personas usuarias que tienen impedimentos visuales pueden solicitar la copia de cualquier título de la biblioteca digital HathiTrust, incluyendo los ítems con derecho de autor vigente, para su uso con tecnologías afines, como los lectores de pantalla.
Programa de revisión de derecho de autor. HathiTrust indaga el estado del derecho de autor de los trabajos disponibles en su colección con la ayuda de un equipo de expertos que encuentran y hacen accesibles los materiales bajo dominio público en EE. UU. y el resto de mundo.
Servicio de acceso temporal emergente. Este servicio permite el acceso temporal emergente de la colección a las librerías miembro durante interrupciones causadas por cualquier evento, desde una pandemia global al impacto catastrófico del cambio climático.
Centro de investigación HathiTrust. Los servicios de este centro de investigación (HTRC, por sus siglas en inglés) apoya el uso del corpus de HathiTrust como un conjunto de datos para el análisis y la investigación basada en minería de texto y de datos.
Programa de impresión compartida. Este programa ha desarrollado una red distribuida y compartida de materiales impresos que se conservan mediante los servicios digitales de HathiTrust.
Programa de documentos federales de EE. UU. El objetivo de este programa es la expansión en el acceso y la preservación de estos documentos.
30/07/202323/12/2023
Directorio de artículos en acceso abierto, en su mayoría en inglés pero también varios en español y otros idiomas
Directory of Open Access Journals (DOAJ) es un directorio único y extensivo de revistas en acceso abierto alrededor del mundo que está manejado por una comunidad en crecimiento y comprometida en asegurar que los contenidos con calidad estén accesibles de manera gratuita para cualquier persona. Esta comunidad está distribuida en cerca de 134 países y habla alrededor de 80 idiomas.
La misión del DOAJ es el incremento global en la visibilidad, accesibilidad, reputación, uso e impacto de las revistas académicas de calidad y revisadas por pares, sin importar su disciplina, ubicación o idioma.
La visión del DOAJ es el compromiso de ser 100% independiente y de mantener todos sus servicios primordiales y metadatos tan gratuitos como se pueda para cualquier persona.
El trabajo del DOAJ es en pos de la construcción de un ecosistema académico equitativo y diverso donde las investigaciones fiables puedan ser globalmente accesibles sin barreras.
DOAJ es una organización independiente y sin fines de lucro gestionada por Infrastructure Services for Open Access (IS4OA), una empresa de interés comunitario con registro en el Reino Unido y con una filial en Dinamarca.
DOAJ está compuesto por un comité asesor y un consejo, cuyos miembros desempeñan sus deberes de manera voluntaria. DOAJ depende completamente de la donación voluntaria de sus simpatizantes. El DOAJ y el IS4OA no reciben subvenciones ni financiamiento de ningún tipo.
El trabajo hecho por el equipo del DOAJ es gracias al apoyo del equipo de redacción, el cual está compuesto por cien voluntarios que ayudan en la revisión de solicitudes. DOAJ también cuenta con una red global de embajadores voluntarios, quienes promueven el acceso abierto y las mejores prácticas en cada una de sus regiones. Todas las personas voluntarias están vinculadas por un acuerdo y deben declarar cualquier conflicto de interés.
19/07/202331/07/2023
Biografía de Arthur O. Lovejoy con enlaces de interés
Arthur Oncken Lovejoy (Berlín, 10 de octubre de 1873 – Baltimore, 30 de diciembre de 1962) fue un filósofo e historiador proponente de la historia de las ideas (HI) en el mundo anglosajón. De manera errónea se le atribuye la fundación de la HI porque Marcelino Menéndez Pelayo fue el primero en acuñar el término (Historia de las ideas estéticas en España, 1883–1889), así como José Ortega y Gasset trabajó sobre la HI durante los mismos años (Ideas y creencias y Sobre la razón histórica, 1940–1944). Pese a esta dificultad, no hay dudas de que Lovejoy se enfocó en teorizar la HI y en refinar sus metodologías.
Este enlace es una ficha de Lovejoy elaborada por el Departamento de Filosofía de la Universidad Johns Hopkins, institución en la que trabajó por casi 40 años. Una de las cuestiones interesantes sobre esta semblanza es que no se enfoca en resumir lo que Lovejoy entendió por HI. Para esto es mejor consultar tres de sus obras —al menos sus primeras secciones— y uno de sus papers: Primitivism and Related Ideas in Antiquity (1935, coescrito con George Boas), The Great Chain of Being: A Study of the History of an Idea (1936), Essays in the History of Ideas (1948) y «Reflections on the History of Ideas» (1940) publicado en el primer número de Journal of the History of Ideas, revista académica que fundó y que permanece activa.
En su lugar, esta ficha menciona más facetas de la vida y obra de Lojevoy como activista social, defensor de la libertad académica, anticomunista, crítico del pragmatismo, epistemólogo, fillósofo de la mente y pensador sobre el tiempo y la evolución. En cada faceta hay enlaces de interés a escritos de Lovejoy disponibles en acceso abierto. Por ello, esta semblanza es un punto de partida para quien tenga interés en la vida y obra de Arthur Oncken Lovejoy.
28/06/202315/05/2024
Entrevista a Chomsky sobre ChatGPT y otros Modelos Grandes de Lenguaje
En esta entrevista en inglés —aquí en español— realizada por Polychroniou, Chosmky de nueva cuenta manifiesta su escepticismo ante los Modelos Grandes de Lenguage (LLM, por sus siglas en inglés). Estas fueron mis citas favoritas (el resaltado es mío, más adelante en español):
As I understand them, the founders of AI—Alan Turing, Herbert Simon, Marvin Minsky, and others—regarded it as science, part of the then-emerging cognitive sciences, making use of new technologies and discoveries in the mathematical theory of computation to advance understanding. Over the years those concerns have faded and have largely been displaced by an engineering orientation.
Engineering projects can be useful, or harmful. Both questions arise in the case of engineering AI. Current work with Large Language Models (LLMs), including chatbots, provides tools for disinformation, defamation, and misleading the uninformed. The threats are enhanced when they are combined with artificial images and replication of voice.
These considerations bring up a minor problem with the current LLM enthusiasm: its total absurdity, as in the hypothetical cases where we recognize it at once. But there are much more serious problems than absurdity.
One is that the LLM systems are designed in such a way that they cannot tell us anything about language, learning, or other aspects of cognition, a matter of principle, irremediable. Double the terabytes of data scanned, add another trillion parameters, use even more of California’s energy, and the simulation of behavior will improve, while revealing more clearly the failure in principle of the approach to yield any understanding. The reason is elementary: The systems work just as well with impossible languages that infants cannot acquire as with those they acquire quickly and virtually reflexively.
Data of performance provide evidence about the nature of the internal system, particularly so when they are refined by experiment, as in standard field work. But even the most massive collection of data is necessarily misleading in crucial ways. It keeps to what is normally produced, not the knowledge of the language coded in the brain, the primary object under investigation for those who want to understand the nature of language and its use.
Unless carefully controlled, AI engineering can pose severe threats. Suppose, for example, that care of patients was automated. The inevitable errors that would be overcome by human judgment could produce a horror story. Or suppose that humans were removed from evaluation of the threats determined by automated missile-defense systems. As a shocking historical record informs us, that would be the end of human civilization.
I can easily sympathize with efforts to try to control the threats posed by advanced technology, including this case. I am, however, skeptical about the possibility of doing so. I suspect that the genie is out of the bottle. Malicious actors—institutional or individual—can probably find ways to evade safeguards. Such suspicions are of course no reason not to try, and to exercise vigilance.
Lo mismo pero en su traducción al español:
Entiendo que los padres de la IA —Alan Turing, Herbert Simon y Marvin Minsky, entre otros— la consideraban una ciencia, parte de las entonces incipientes ciencias cognitivas, y se valían de las nuevas tecnologías y los nuevos descubrimientos en la teoría matemática de la computación para avanzar en el entendimiento. A lo largo de los años, esa tendencia ha ido desapareciendo y se ha visto desplazada en gran medida por el enfoque de la ingeniería.
Los proyectos de ingeniería pueden ser útiles o perjudiciales. Ambas cuestiones se plantean también en el caso de la ingeniería de IA. El trabajo actual con modelos de lenguaje LLM, como los chatbots, ofrece herramientas para desinformar, difamar y confundir a los que no tienen muchos datos. La amenaza es mayor cuando se combinan con imágenes artificiales y réplicas de voz.
Estas consideraciones sacan a relucir un pequeño problema del entusiasmo actual con los LLM: que son totalmente absurdos, como en los casos hipotéticos, que se veía enseguida. Sin embargo, hay problemas mucho más graves que el absurdo.
Uno de ellos es que los sistemas de LLM están diseñados de tal manera que no nos dicen nada del lenguaje, del aprendizaje ni de otros aspectos cognitivos, y es una cuestión de principio, irremediable. Aunque dupliquemos los terabytes de datos registrados, añadamos unos millones de parámetros más y utilicemos todavía más energía de California, la simulación de comportamiento mejorará, pero al mismo tiempo, revelará con mayor claridad el fracaso de principio de un enfoque que no busca ningún tipo de entendimiento. La razón es evidente: los sistemas funcionan igual de bien con lenguas imposibles de aprender que con las que los niños adquieren rápido y casi instintivamente.
Los datos de la actuación ofrecen pruebas sobre la naturaleza del sistema interno, especialmente cuando los experimentos los hacen más precisos, como es habitual en el trabajo de campo. Pero hasta la recolección de datos más exhaustiva induce necesariamente a error en aspectos cruciales. Se atiene a lo que se produce normalmente, no al conocimiento del lenguaje codificado en el cerebro, objeto principal de investigación para los que quieren entender la naturaleza del lenguaje y su uso.
A menos que se controle con cuidado, la ingeniería de IA puede representar serias amenazas. Supongamos, por ejemplo, que el cuidado de pacientes estuviera automatizado. Los errores inevitables que el juicio humano solucionaría podrían provocar una historia de terror. O imaginemos que apartamos a los humanos de la evaluación de amenazas determinadas por los sistemas automatizados de defensa antimisiles. Como nos indica un documento histórico estremecedor, sería el final de la civilización humana.
Comprendo perfectamente los esfuerzos de quienes intentan controlar las amenazas que supone la tecnología avanzada, también en este caso. Sin embargo, soy escéptico acerca de la posibilidad de llevarlo a cabo. Me temo que la caja de Pandora ya está abierta. Los actores maliciosos —institucionales o particulares— seguramente encuentren las vías para eludir las salvaguardias. Aunque estos temores, por supuesto, no son motivo para no intentarlo ni para bajar la guardia.
24/06/202331/07/2023
Obras completas en ebook de Menéndez Pelayo, Andrés Bello, Francisco Manuel de Melo y José de Anchieta
La Biblioteca Virtual de Polígrafos (BVP) de la Fundación Ignacio Larramendi se propone —a partir de una idea de Menéndez Pelayo, creador del término polígrafo en el sentido que se emplea aquí— hacer accesible el pensamiento de polígrafos españoles, portugueses, brasileños e hispanoamericanos mediante la recopilación digital de sus obras. El proyecto en parte se lleva a cabo mediante la colaboración con otras instituciones.
La palabra polígrafo se refiere en este contexto al creador polifacético cuya obra marcó un punto de inflexión en su campo. Se llama poligrafista al investigador especialista en alguno o algunos de los polígrafos que componen la BVP y que escribe un estudio sobre su figura y su obra.
La BVP es un proyecto que ideó y puso en marcha Ignacio Hernando de Larramendi en los años noventa del siglo XX, con la intención de aprovechar las posibilidades que las incipientes nuevas tecnologías ofrecían para la conservación y la difusión del conocimiento.
Ignacio Larramendi centró esta biblioteca en cuatro colecciones que recibieron el nombre de uno de los polígrafos más importantes de cada una de ellas: Marcelino Menéndez Pelayo, para la colección de polígrafos españoles, José de Anchieta, para la de brasileños, Francisco Manuel de Melo, para la de portugueses, y Andrés Bello, para la de hispanoamericanos.
La BVP ha sido seleccionada por el clúster de datos bibliográficos de la W3C como Case Study. También ha sido elegida por Europeana como un EDM Case Study.
15/05/202331/07/2023
Directorio de libros en acceso abierto, en su mayoría en inglés pero también varios en español y otros idiomas
Directory of Open Access Books (DOAB) tiene como principal objetivo el aumento en la visibilidad de libros en acceso abierto. Los editores académicos están invitados a proveer metadatos de sus libros en acceso abierto a DOAB.
DOAB es una infraestructura abierta comprometida con la ciencia abierta. Funciona con la plataforma de acceso abierto DSpace 6. Los metadatos pueden recolectarse con el fin de maximizar la diseminación, visiblidad e impacto. Quienes agregan la información pueden integrar los registros a sus servicios comerciales y las bibliotecas pueden integrar el directorio a sus catálogos en línea, lo cual ayuda a académicos y estudiantes a descubrir los libros. El directorio está abierto a cualquier editor que publique libros académicos, revisados por pares y en acceso abierto, así como puede contener tantos libros como sean posibles, siempre y cuando esas publicaciones tengan acceso abierto y se conformen con los estándares académicos.
DOAB fue establecido por la fundación OAPEN en 2012 y en cooperación estrecha con Directory of Open Access Journals (DOAJ) y SemperTool. Esta fundación es una entidad holandesa sin fines de lucro que fue establecida por la fundación OAPEN y OpenEdition en 2019. La fundación tiene su sede en la Biblioteca Nacional de los Países Bajos. Los desarrollos y actualizaciones clave del DOAB están disponibles en su reporte anual y en coordinación con OpenEdition.
25/01/202331/07/2023
Plataforma comunitaria de juegos de mesa en línea
Board Game Arena (BGA) fue creado en 2010 por Grégory Isabelli y Emmanuel Colin, dos profesionales de la informática apasionados por los juegos de mesa. Durante 7 años y en sus tiempos libres Grégory y Emmanuel trabajaron en la consolidación de BGA como la plataforma para jugar juegos de mesa en línea. En 2018 por fin pudieron dedicarse a BGA en tiempo completo. En 2021 se unió al Grupo Asmodee.
Unas de las características fundamentales que permitió el crecimiento de BGA fueron las siguientes:
Para su rentabilidad Grégory y Emmanuel dividieron la base de usuarios en gratuitos y premium. Los usuarios premium dan un aporte anual o mensual a cambio de la eliminación del tiempo de espera para jugar una partida, la posibilidad de jugar varios usuarios en el mismo dispositivo o en la misma ubicación física, la habilitación de videollamadas en el chat y el acceso ilimitado a los juegos premium. Cabe resaltar que la mayoría de los juegos en BGA son gratuitos y los que son premium pueden ser jugados por cualquier usuario, el único requisito es que haya al menos un usuario premium en cada partida.
A los jugadores que colaboran en la creación o mantenimiento de los juegos obtienen tokens («puntos de regalo») que pueden intercambiar por membresías premium. Un usuario obtiene tokens al jugar, recomendar BGA, traducir, escribir un tutorial, moderar en el foro, revisar un juego, corregir errores en juegos y desarrollar nuevos juegos (requiere saber PHP, SQL, HTML y JavaScript). Así que más tokens se obtienen entre más activo se esté en BGA.
A las editoriales de juegos de mesa se les ofrece un modelo de negocio en el que no requieren hacer ninguna inversión para la adaptación y la inclusión de su juego en el catálogo de BGA bajo una licencia no comercial y no exclusiva. Además, la editorial da el visto bueno antes de la publicación del juego y, si su juego es premium, puede recibir 33.3% (si es hecho en tiempos libres y de manera gratuita por la comunidad) o 50% (si se quiere una fecha de entrega y se paga directamente como freelance a algunos miembros de la comunidad) de los ingresos generados por el juego.
Sin duda un estudio de caso interesante sobre cómo una plataforma comunitaria de manera legal puede obtener ingresos o acceso a material protegido por derecho de autor.