龙盟编程博客 | 无障碍搜索 | 云盘搜索神器
快速搜索
主页 > 软件开发 > JAVA开发 >

Java Unicode转义字符的小小研究

时间:2009-12-23 15:42来源:未知 作者:admin 点击:
分享到:
转义字符 所有的转义字符都是由 打头的 第二个字符 0-9 :八进制 u :是Unicode转意,长度固定为6位 Other:则为以下字母中的一个 b,t,n,f,r,", 都不满足,则产生一个编译错误。 当然了,提供八

  转义字符
    所有的转义字符都是由 '' 打头的
    第二个字符
        0-9  :八进制
        u    :是Unicode转意,长度固定为6位
        Other:则为以下字母中的一个 b,t,n,f,r,",
              都不满足,则产生一个编译错误。

  
    当然了,提供八进制也是为了和C语言兼容.

    b,t,n,f,r 则是为控制字符.书上的意思为:描述数据流的发送者希望那些信息如何被格式化或者被表示.

    Unicode转义字符非常有趣
    它可以写在代码的任意位置,只要转义后是合法的.
    例如:

    int c=0u003b
    上面的代码可以编译通过,等同于int c=0; u003b也就是';'的Unicode代码

    上面的例子不能让人很信服,所以特地写了下面这一段代码用来将字符串转换成为unicode字符
    然后你可以将打印出来的代码放置在EggHello.Java中,然后运行它,结果是让人激动的。

  
  /*
   * author:鸡蛋 date:2004/11/10 字符串转换为Unicode
   */
  public class Asc2Unicode {
   private StringBuffer ch;

   private StringBuffer tch;

   Asc2Unicode(StringBuffer s) {
    ch = s;
    if (ch.length() > 0)
     tch = new StringBuffer(1000);
   }

   void transform() {
    if (ch.length() < 1)
     return;
    for (int i = 0; i < ch.length(); i++) {
     (new Integer((int) ch.charAt(0))).toString();
     tch.append(new StringBuffer("u00"));
     tch.append(new StringBuffer(new String(Integer.toHexString((int) ch
       .charAt(i)))));
    }
   }

   StringBuffer getStr() {
    return tch;
   }

   public static void main(String[] argv) {
    Asc2Unicode au = new Asc2Unicode(new StringBuffer(new String(
      "public class EggHello{"
        + "   public static void main(String[] argv){"
        + "System.out.println("Hello,World");" + "}" + "}"
    )
    ));
    au.transform();
    System.out.println(au.getStr());
   }
  }

  
  打印如下:
  u0070u0075u0062u006cu0069u0063u0020u0063u006cu0061u0073u0073u0020u0045u0067u0067u0048u0065u006cu006cu006fu007bu0020u0020u0020u0070u0075u0062u006cu0069u0063u0020u0073u0074u0061u0074u0069u0063u0020u0076u006fu0069u0064u0020u006du0061u0069u006eu0028u0053u0074u0072u0069u006eu0067u005bu005du0020u0061u0072u0067u0076u0029u007bu0053u0079u0073u0074u0065u006du002eu006fu0075u0074u002eu0070u0072u0069u006eu0074u006cu006eu0028u0022u0048u0065u006cu006cu006fu002cu0057u006fu0072u006cu0064u0022u0029u003bu007du007d
  

  
    感觉有点像加密的代码一样! 当然那都是掩耳盗铃。。。
    不过初看起来还是比较让人头晕的。

    Unicode转义就先研究到这里,喝点水,打会游戏。。。
  
  

精彩图集

赞助商链接