unicode

¿Cómo funciona Zalgo text?

He visto texto extrañamente formateado llamado Zalgo como a continuación escrito en varios foros. Es un poco molesto de mirar ... uales tienen propiedades extrañas? ¿"Qué" está pasando aquí? HwW dŏes Z ą ągogo te x xț wor wor?̙͉̥̬͙̟̮͕ͤ̌͗ͩ̕͡

¿Qué es un" par sustituto " en Java?

Estaba leyendo la documentación para StringBuffer, en particular el método reverse(). Esa documentación menciona algo sobre pares sustitutos. ¿Qué es una pareja sustituta en este contexto? ¿Y qué son los sustitutos bajos y altos ?

¿Cómo se hace eco de un carácter Unicode de 4 dígitos en Bash?

Me gustaría añadir el cráneo Unicode y los huesos cruzados a mi mensaje de shell (específicamente el 'CRÁNEO Y los HUESOS CRU ... forma predeterminada. En la aplicación Terminal de macOS, vaya a Preferencias-> Codificaciones y elija Unicode (UTF-8).

La mejor manera de invertir una cadena

Simplemente tuve que escribir una función inversa de cadena en C# 2.0 (es decir, LINQ no está disponible) y se me ocurrió est ... n reverse; } Personalmente no estoy loco por la función y estoy convencido de que hay una mejor manera de hacerlo. ¿Lo hay?

Caracteres Unicode en URLs

En 2010, ¿serviría URLs que contengan caracteres UTF-8 en un gran portal web? Los caracteres Unicode están prohibidos según ... de copiar+pegar con los caracteres especiales intactos, pero funciona correctamente cuando se reutiliza en clientes antiguos?

¿Por qué este código, escrito al revés, imprime "Hello World!"

Aquí hay un código que encontré en Internet: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H',' ... funciona en notepad++, junto con cmd. Todavía no he encontrado una solución a eso, así que si alguien lo hace, comente abajo.

Convertir una cadena Unicode a una cadena en Python (que contiene símbolos adicionales)

Cómo convertir una cadena Unicode (que contiene caracteres adicionales como££, etc.) en una cadena de Python?

¿Cómo obtener objetos de cadena en lugar de Unicode desde JSON?

Estoy usando Python 2para analizar JSON desde archivos de texto codificados en ASCII. Al cargar estos archivos con cualqu ... ado con Python 2. Una solución fácil y limpia para hoy es usar una versión reciente de Python-es decir, Python 3 y adelante.

Cuál es la diferencia entre UTF - 8 y Unicode

He escuchado opiniones contradictorias de la gente - según Wikipedia, ver aquí. Son la misma cosa, ¿no? ¿Alguien puede aclararlo?

Cómo encontrar la longitud de una cadena en R?

¿Cómo encontrar la longitud de una cadena (número de caracteres en una cadena) sin dividirla en R? Sé cómo encontrar la long ... n una cadena Unicode? Pregunta relacionada: Cómo encontrar el número "real" de caracteres en una cadena Unicode en R

¿Cuál es la mejor manera de eliminar acentos en una cadena unicode de Python?

Tengo una cadena Unicode en Python, y me gustaría eliminar todos los acentos (diacríticos). Encontré en la Web una forma ele ... importante: Me gustaría evitar el código con una asignación explícita de caracteres acentuados a su contraparte no acentuada.

¿Por qué se permite ejecutar código Java en comentarios con ciertos caracteres Unicode?

El siguiente código produce la salida "Hello World!"(no realmente, pruébalo). public static void main(String... args) { ... ador malvado pueda concebir, ¿por qué se permite en los comentarios? ¿Por qué está permitido esto por Java especificación?

¿De qué se trata UTF-8 normalizado?

El proyecto ICU (que ahora también tiene una biblioteca PHP) contiene las clases necesarias para ayudar a normalizar las ca ... aciones. Por ejemplo, ¿en qué casos quiero "Equivalencia Canónica" en lugar de "Equivalencia de compatibilidad", o vis-versa?

¿Cómo puedo grep para todos los caracteres no ASCII?

Tengo varios archivos XML muy grandes y estoy tratando de encontrar las líneas que contienen caracteres no ASCII. He intentad ... lgo mal? También he intentado: egrep "[\x{00FF}-\x{FFFF}]" file.xml (con comillas simples y dobles rodeando el patrón).

UTF-8, UTF-16 y UTF-32

¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode, y que cada uno usa un número diferente de bytes para representar un carácter. ¿Hay alguna ventaja en elegir uno sobre el otro?

¿Cómo comparar caracteres Unicode que "se parecen"?

Caigo en un asunto sorprendente. He cargado un archivo de texto en mi aplicación y tengo cierta lógica que compara el valor ... res que son así. ¿Hay alguna forma en C# de comparar los caracteres que se ven iguales pero que en realidad son diferentes?

Error de Codificación de Python Unicode

Estoy leyendo y analizando un archivo XML de Amazon y mientras el archivo XML muestra un', cuando intento imprimirlo obtengo ... cado en ASCII. ¿Hay una manera sencilla de hacer que el error desaparezca y hacer que mi programa imprima el XML como se lee?

Python: Usando.format() en una cadena con escape Unicode

Estoy usando Python 2.6.5. Mi código requiere el uso del signo "más que o igual a". Aquí va: >>> s = u'\u2265' > ... t in range(128)` ¿Por qué obtengo este error? Hay una manera correcta de hacer esto? Necesito usar la función .format().

Uso de awk para eliminar la marca de orden de bytes

¿Cómo se vería un script awk (presumiblemente de una sola línea) para eliminar un BOM ? Especificación: imprima cada l ... a después de la primera (NR > 1) para la primera línea: Si comienza con #FE #FF o #FF #FE, elimínelas e imprima el resto

¿Por qué Python imprime caracteres unicode cuando la codificación predeterminada es ASCII?

Del shell Python 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' ... fica ASCII siendo la codificación por defecto. EDITAR Moví la edición a la sección Respuestas y la acepté como se sugirió.