安装cacti监控

FreeBSD 7.0-RELEASE-i386

# cd /usr/ports/net-mgmt/net-snmp && make install clean
# cd /usr/ports/net-mgmt/cacti && make install clean

ucd-snmp不选

# make pretty-print-run-depends-list

This port requires package(s) “mysql-client-5.0.67_1” to run.

# cd /usr/ports/databases/mysql50-server && make install clean
# echo ‘mysql_enable=”YES”‘ >> /etc/rc.conf
# /usr/local/etc/rc.d/mysql-server start
# mysqladmin –user=root create cacti
# echo “GRANT ALL ON cacti.* TO cactiuser@localhost IDENTIFIED BY ‘cactiuser’; FLUSH PRIVILEGES;” | mysql
# mysql cacti < /usr/local/share/cacti/cacti.sql

# echo ‘rocommunity public’ >> /usr/local/share/snmp/snmpd.conf
# /usr/local/etc/rc.d/snmpd start
# netstat -na | grep “LISTEN”
# sockstat

//199 161 port

# snmpwalk -v 1 -c public 127.0.0.1 system

# ee /etc/rc.conf

snmpd_enable=”YES”
snmpd_flags=”-a”
snmpd_pidfile=”/var/run/snmpd.pid”
snmptrapd_enable=”YES”
snmptrapd_flags=”-a -p /var/run/snmptrapd.pid”

# ee /usr/local/share/cacti/include/config.php
# ee /usr/local/etc/apache22/Includes/cacti.conf

Alias /cacti “/usr/local/share/cacti/”

<Directory “/usr/local/share/cacti/”>
Options None
AllowOverride None
Order allow,deny
Allow from all
</Directory>

# apachectl configtest
# apachectl restart

# cd /usr/ports/databases/phpmyadmin && make install clean
# cp /usr/local/www/phpMyAdmin/config.sample.inc.php /usr/local/www/phpMyAdmin/config.inc.php
# ee /usr/local/www/phpMyAdmin/config.inc.php

$cfg[‘blowfish_secret’] = ‘erw34’; //随便写什么

# ee /usr/local/etc/apache22/Includes/phpmyadmin.conf

Alias /phpmyadmin/ “/usr/local/www/phpMyAdmin/”

<Directory “/usr/local/www/phpMyAdmin/”>
Options none
AllowOverride Limit

Order Deny,Allow
Deny from all
Allow from 127.0.0.1 .example.com
</Directory>

# apachectl configtest
# apachectl restart

http://localhost/cacti/
next >> 完成
登录名:admin
密码:admin
配置完成后。

# /usr/local/bin/php /usr/local/share/cacti/poller.php
# crontab -u cacti -e

*/5 * * * * /usr/local/bin/php /usr/local/share/cacti/poller.php > /dev/null 2>&1

# cat /usr/local/share/cacti/log/cacti.log

参考:
CACTI Version 0.8.7a for FreeBSD 6.2 release 配置全攻略

FreeBSD下用cacti抓取内存信息的方法

安装awstats的过程

# mkdir /etc/awstats
# mkdir /var/lib
# mkdir -m 777 /var/lib/awstats
# cp /usr/local/www/awstats/cgi-bin/awstats.model.conf /etc/awstats/awstats.www.mysite.com.conf
# ee /etc/awstats/awstats.www.mysite.com.conf

第51行:LogFile=”/var/log/apache/www.mysite.com/%YYYY-24%MM-24/httpd-access_%YYYY-24%MM-24%DD-24.log”
第152行:SiteDomain=”www.mysite.com”
第167行:HostAliases=”mysite.com www.mysite.com 127.0.0.1 localhost 192.168.0.74″
第202行:DirData=”/var/lib/awstats”
第238行:AllowToUpdateStatsFromBrowser=1
第449行:DefaultFile=”index.php index.htm index.html”
第1515行:Include “awstats.www.mysite.com.conf”

# ee /usr/local/etc/apache22/Includes/awstats.conf

#
# Directives to allow use of AWStats as a CGI
#
Alias /awstatsclasses “/usr/local/www/awstats/classes/”
Alias /awstatscss “/usr/local/www/awstats/css/”
Alias /awstatsicons “/usr/local/www/awstats/icons/”
ScriptAlias /awstats/ “/usr/local/www/awstats/cgi-bin/”

#
# This is to permit URL access to scripts/files in AWStats directory.
#
<Directory “/usr/local/www/awstats/”>
Options None
AllowOverride None
Order allow,deny
Allow from all
</Directory>

# apachectl configtest
# apachectl restart

# ee /usr/local/www/awstats/update-logs.sh

/usr/local/www/awstats/cgi-bin/awstats.pl -config=www.mysite.com -update

# chmod 755 /usr/local/www/awstats/update-logs.sh
# setenv EDITOR ee
# crontab -e

10 1 * * * /bin/csh /usr/local/www/awstats/update-logs.sh

不统计指定IP的访问量
SkipHosts=”x.x.x.x.”

参考:安装Apache2.2


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

FREEBSD安装中文桌面的过程

FreeBSD 7.0-RELEASE-i386

CD安装Xorg、KDE(速度快)

# sysinstall
Configuration->packages->选择cd->进入x11->找xorg->选中->install
Configuration->packages->选择cd->进入KDE->找kde->选中->install
(选择FTP也可以)

或者编译安装Xorg、KDE(速度慢)

# cd /usr/ports/x11/xorg && make OPTIONS=NO install clean
# cd /usr/ports/x11/kde3 && make OPTIONS=NO install clean
(约20—-30小时,期间可能有错误停止编译)

或者使用
# pkg_add -r xorg
# pkg_add -r kde3
(速度比较快)

不配置/etc/X11/xorg.conf,使用系统自动配置
要自己配置的话:

# Xorg -configure
# Xorg -config xorg.conf.new
# cp xorg.conf.new /etc/X11/xorg.conf

# startx
测试,Ctrl+Alt+Backspace退出X

安装中文环境
# cd /usr/ports/chinese/kcfonts && make install clean
# cd /usr/ports/chinese/arphicttf && make install clean
# cd /usr/ports/chinese/kde3-i18n-zh_CN && make install clean
# cd /usr/ports/chinese/koffice-i18n-zh_CN && make install clean
如果您想要有Windows的字体,可以到将Win上面的字体COPY到下面的目录
# cd /usr/X11R6/lib/X11/fonts/TrueType

安装FireFox:
# cd /usr/ports/www/firefox3 && make install clean
# cd /usr/ports/www/firefox3-i18n && make install clean
在地址栏输入about:config,搜索general.useragent.locale,改为zh-CN

出错处理:
# cd /usr/ports/devel/glib20 && make OPTIONS=NO FORCE_PKG_REGISTER=YES install clean
(http://unix.derkeiler.com/Mailing-Lists/FreeBSD/questions/2008-10/msg01701.html)
# cd /usr/ports/x11/pixman && make OPTIONS=NO FORCE_PKG_REGISTER=YES install clean
# cd /usr/ports/graphics/cairo && make OPTIONS=NO FORCE_PKG_REGISTER=YES install clean
(http://www.nabble.com/CALL-FOR-TEST:-Updates-to-pixmap,-cairo,-poppler,-and-firefox-3.0!-td17960163.html)

安装聊天工具 gaim
# cd /usr/ports/net-im/pidgin && make install clean

中文输入法安装:
# cd /usr/ports/chinese/scim-tables/ && make install clean #五笔
# cd /usr/ports/chinese/scim-pinyin/ && make install clean #拼音
# ee ~/.cshrc

setenv LANG zh_CN.eucCN
setenv LC_CTYPE zh_CN.eucCN
setenv XMODIFIERS @im=SCIM
setenv GTK_IM_MODULE scim

# echo “exec /usr/local/bin/scim &” >> ~/.xinitrc
# echo “exec /usr/local/bin/startkde” >> ~/.xinitrc
# startx

进入KDE。
找到Setting->Desktop Setting Wizard选择中文。
然后打开”控制中心”->外观和主题->字体,里面设置你所需要的中文字体和字体大小。强制字体DPI越大字越大。
打开FireFox,打开about:config,搜索layout.css.dpi,设置dpi为0,-1为FireFox默认的DPI,0为KDE系统DPI。

备注:安装过程如有软件版本冲突,安装命令加FORCE_PKG_REGISTER=YES强行安装

# cat /etc/X11/xorg.conf
Section “ServerLayout”
Identifier “X.org Configured”
Screen 0 “Screen0” 0 0
InputDevice “Mouse0” “CorePointer”
InputDevice “Keyboard0” “CoreKeyboard”
EndSection

Section “Files”
RgbPath “/usr/local/share/X11/rgb”
ModulePath “/usr/local/lib/xorg/modules”
FontPath “/usr/local/lib/X11/fonts/misc/”
FontPath “/usr/local/lib/X11/fonts/TTF/”
FontPath “/usr/local/lib/X11/fonts/OTF”
FontPath “/usr/local/lib/X11/fonts/Type1/”
FontPath “/usr/local/lib/X11/fonts/100dpi/”
FontPath “/usr/local/lib/X11/fonts/75dpi/”
EndSection

Section “Module”
Load “GLcore”
Load “dbe”
Load “dri”
Load “extmod”
Load “glx”
Load “record”
Load “xtrap”
Load “freetype”
Load “type1”
EndSection

Section “InputDevice”
Identifier “Keyboard0”
Driver “kbd”
EndSection

Section “InputDevice”
Identifier “Mouse0”
Driver “mouse”
Option “Protocol” “auto”
#Option “Device” “/dev/sysmouse”
Option “ZAxisMapping” “4 5 6 7”
EndSection

Section “Monitor”
Identifier “Monitor0”
VendorName “Monitor Vendor”
ModelName “Monitor Model”
EndSection

Section “Device”
Identifier “Card0”
Driver “vesa”
VendorName “Silicon Integrated Systems [SiS]”
BoardName “661/741/760 PCI/AGP or 662/761Gx PCIE VGA Display Adapter”
BusID “PCI:1:0:0”
EndSection

Section “Screen”
Identifier “Screen0”
Device “Card0”
Monitor “Monitor0”
DefaultDepth 24
SubSection “Display”
Viewport 0 0
Depth 24
Modes “1024×768” “800×600”
EndSubSection
EndSection


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

FREEBSD常用命令

FreeBSD 7.0-RELEASE-i386

删除Thumbs.db文件
find ./ -name “*.db” -delete

显示所有没有被注释的
# cat file | grep -v ‘^#’

搜索PORTS软件
# whereis XXXX

系统情况
top
vmstat -s
lmmon -i
mbmon
xmbmon

自定义pkg_add安装的服务器
setenv PACKAGEROOT ftp://ftp.cn.freebsd.org

Port 的相关命令

生成配置文件
make config
删除配置文件
make rmconfig
抓取源码包
make fetch
抓取所有源码包(包括需要到的所有包)
make fetch-recursive
校验源码包
make checksum
编译、安装并删除临时文件
make install clean
编译、安装、将所有需要的port打包、安装、并删除临时文件
make depends_target=package package clean
mkdir -p /usr/ports/packages/All/
生成的package会自动放到里面,否则放在port的当前目录
仅解开源码包
make extract
仅解开并打上patch
make patch
删除临时文件及源码包
make distclean
查询port的依赖关系
make all-depends-list #显示所有相关的套件
make pretty-print-build-depends-list
#显示编译期间所需要的套件
make pretty-print-run-depends-list
#显示此套件要执行时所需要的套件
删除已经安装的port
make deinstall
删除已经安装的port及其依赖
make deinstall-depends
重新安装port
make reinstall
搜索port
make search key=keyword
make search name=nameword
指定port安装目录
make PREFIX=path install
更新port MK
cd /usr/src/share/mk
make install
解决安装时的sed -i 错误
make -DUSE_REINPLACE install
更新port index对照表
cd /usr/ports/
make index
更新index html
cd /usr/ports/
make readmes

# pw groupadd 创建新组


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

安装POSTGRESQL

FreeBSD 7.0-RELEASE-i386

# cd /usr/ports/databases/postgresql83-server && make install clean
# echo ‘postgresql_enable=”YES”‘ >> /etc/rc.conf
# /usr/local/etc/rc.d/postgresql initdb
# passwd pgsql
# su – pgsql
$ createuser -P -s -e XXXX (创建一个新的超级用户)

安装phpPgAdmin
# cd /usr/ports/databases/phppgadmin && make install clean
# ee /usr/local/etc/apache22/Includes/phppgadmin.conf

Alias /phppgadmin/ “/usr/local/www/phpPgAdmin/”

<Directory “/usr/local/www/phpPgAdmin/”>
Options none
AllowOverride Limit

Order Deny,Allow
Deny from all
#Allow from 127.0.0.1 .example.com
Allow from 127.0.0.1 192.168
#Allow from all
</Directory>

# ee /usr/local/www/phpPgAdmin/conf/config.inc.php

$conf[‘default_lang’] = ‘chinese-utf8-zh_CN’;

# apachectl restart

http://localhost/phppgadmin/

安装过程错误解决:
如果先安装了KDE3或者其他软件,再安装postgresql83可能会提示冲突终止安装,比如提示postgresql81-client冲突.
# cd /usr/ports/databases/postgresql81-client && make deinstall
卸载postgresql81-client再重新安装
如果有安装PHP5还要重新安装pgsql.so和pdo_pgsql.so
# cd /usr/ports/databases/php5-pgsql && make deinstall
# cd /usr/ports/lang/php5-extensions && make reinstall clean FORCE_PKG_REGISTER=YES

重启PGSQL
$ pg_ctl restart -D /usr/local/pgsql/data/
重载配置文件
$pg_ctl reload -D /usr/local/pgsql/data/

远程登录

postgresql.conf

listen_addresses = ‘*’

pg_hba.conf

hostssl all all 192.168.0.1/24 md5
hostssl all all 12.12.151.15/32 md5


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

安装FreeBSD

FreeBSD 7.0-RELEASE-i386

CD安装:7.0-RELEASE-i386-disc1.iso

Country Selection –> China
System Console Keymap –> USA ISO
FreeBSD/i386 7.0-RELEASE – Sysinstall Main Menu
–> Custom
  3. Partition 选择安装分区,多个硬盘要选择硬盘
    D 删除选择的分区
    A 自动分区,注意如果硬盘上有其他系统请注意!
    C 在选择的分区上创建FreeBSD
    Q 完成
    Install Boot Manager for drive 完成后要求选择启动
      Bootmgr 选择启动
      Standand 从FreeBSD启动
  4. Label 分区标记
    A 自动
    Q 完成
  5. Distributions 选择安装组件
    base
    kernels
    dict
    doc
    info
    man
    catman
    proflibs
    src >> All
    ports
    local
    需要桌面的再选择X.org
  6. Media 选择安装媒介
  7. Commit 开始安装
–>Configuration
  Networking
    –> Interfaces (选网卡,不选IPv6,选DHCP
    –> sshd
  Root Password
  Time Zone
退出安装,重启

安装后:
# ee /etc/portsnap.conf

SERVERNAME=portsnap.tw.FreeBSD.org

# portsnap fetch update
# portsnap extract

第一次使用可以 portsnap fetch extract
以后使用可以 portsnap fetch update
如果写在cron可以用 portsnap cron update

# ee /root/.cshrc

setenv EDITOR ee
set prompt = “%B%n@%m[%/]# “

%B(粗體字)
%n(UserName)
%m(HostName)
%/(目前所在的路徑)

# ee /etc/csh.cshrc

set prompt = “%B%n@%m[%/]% “

# source /etc/csh.cshrc
# source ~/.cshrc
# adduser

# ee /etc/make.conf

MASTER_SITE_BACKUP?=\
ftp://ftp.cn.freebsd.org/pub/FreeBSD/ports/distfiles/${DIST_SUBDIR}/\
ftp://ftp.tw.freebsd.org/pub/FreeBSD/ports/distfiles/${DIST_SUBDIR}/\
ftp://ftp.jp.freebsd.org/pub/FreeBSD/ports/distfiles/${DIST_SUBDIR}/
MASTER_SITE_OVERRIDE?=${MASTER_SITE_BACKUP}

绑IP
# ee /etc/rc.conf

ifconfig_rl0=”inet X.X.X.X netmask 255.255.255.0″ //IP地址
defaultrouter=”X.X.X.X” //网关地址
hostname=”mywebsite.com”

# ee /etc/resolv.conf

search mywebsite.com
nameserver 218.85.157.99 //DNS地址


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

安装Apache2.2

FreeBSD 7.0-RELEASE-i386

# cd /usr/ports/www/apache22 && make install clean
# cd /usr/ports/www/awstats && make install clean 安装awstats的过程
# cd /usr/ports/sysutils/cronolog && make install clean

# ee /usr/local/etc/apache22/httpd.conf

Line 143: Set Administrator’s email address
Line 152: Uncomment, set machine.name.com for the ServerName
Line 205: Options All,AllowOverride All (.htaccess)
Line 323: For cgi-bin, Options FollowSymLinks ExecCGI
配置cronolog:
Line236: ErrorLog “|/usr/local/sbin/cronolog /var/log/apache/www.mysite.com/%Y%m/httpd-error_%Y%m%d.log”
Line271: CustomLog “|/usr/local/sbin/cronolog /var/log/apache/www.mysite.com/%Y%m/httpd-access_%Y%m%d.log” combined
# mkdir -m 777 /var/log/apache
# mkdir -m 777 /var/log/apache/www.mysite.com

# echo ‘apache22_enable=”YES”‘ >> /etc/rc.conf
# echo ‘apache22ssl_enable=”YES”‘ >> /etc/rc.conf

# apachectl configtest
# apachectl start

安装过程错误解决:
先安装Xorg和KDE后再安装Apache22,可能会出现安装错误提示:

===> Installing for apache-2.2.9

===> apache-2.2.9 conflicts with installed package(s):
apr-db42-1.2.8_2

They install files into the same place.
Please remove them first with pkg_delete(1).
*** Error code 1

Stop in /usr/ports/www/apache22.
*** Error code 1

Stop in /usr/ports/www/apache22.

解决方法如下:

# cd /usr/ports/www/apache22
# make config
选择 APR_FROM_PORTS (第一个)
# make install clean

启动错误解决:
No such file or directory: Failed to enable the ‘httpready’ Accept Filter

# echo ‘accf_data_load=”YES”‘ >> /etc/rc.conf
# echo ‘accf_http_load=”YES”‘ >> /etc/rc.conf

mod_unique_id: unable to find IPv4 address of “#########” on Failed

关闭mod_unique_id.so

#LoadModule unique_id_module libexec/apache22/mod_unique_id.so

虚拟主机
# ee /usr/local/etc/apache22/extra/httpd-vhosts.conf

NameVirtualHost *:80

<virtualhost *:80>
ServerAdmin webmaster@mywebsite.org
DocumentRoot “/usr/local/www/apache22/data”
ServerName mywebsite.org
ErrorLog “|/usr/local/sbin/cronolog /var/log/apache/mywebsite.org/%Y%m/httpd-error_%Y%m%d.log”
CustomLog “|/usr/local/sbin/cronolog /var/log/apache/mywebsite.org/%Y%m/httpd-access_%Y%m%d.log” combined
Redirect 301 / http://www.mywebsite.com/
</virtualhost>

<virtualhost *:80>
ServerAdmin webmaster@mywebsite.com
DocumentRoot “/usr/local/www/apache22/data/mywebsite.com”
ServerName www.mywebsite.com
ServerAlias *.mywebsite.com
#ErrorLog “/var/log/dummy-host.example.com-error_log”
#CustomLog “/var/log/dummy-host.example.com-access_log” common
ErrorLog “|/usr/local/sbin/cronolog /var/log/apache/mywebsite.com/%Y%m/httpd-error_%Y%m%d.log”
CustomLog “|/usr/local/sbin/cronolog /var/log/apache/mywebsite.com/%Y%m/httpd-access_%Y%m%d.log” combined
</virtualhost>


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

安装PHP5

FreeBSD 7.0-RELEASE-i386

# cd /usr/ports/lang/php5 && make install clean

Options: CLI, APACHE, IPV6

# cd /usr/ports/devel/pear && make install clean
# cd /usr/ports/lang/php5-extensions && make install clean

Options:
  • bz2
  • calendar
  • curl
  • DBA
  • dom
  • FILTER
  • ftp
  • gd
  • gettext
  • HASH
  • iconv
  • imap
  • JSON
  • ldap
  • mbstring
  • mcrypt
  • mhash
  • mysql
  • mysqli
  • openssl
  • pcre
  • pdf
  • pdo
  • PDO_SQLITE
  • pgsql
  • posix
  • pspell
  • READLINE
  • session
  • simplexml
  • SNMP
  • soap
  • sockets
  • SPL
  • sqlite
  • tidy
  • tokenizer
  • wddx
  • XML
  • xmlreader
  • xmlrpc
  • xmlwriter
  • yaz
  • zip
  • zlib

(安装期间,如果Tidy出错,直接删除Tidy即可
# cd /usr/ports/www/tidy && make deinstall)

# cd /usr/ports/databases/php5-pdo_pgsql && make install clean
# cd /usr/ports/databases/php5-pdo_mysql && make install clean

# cp /usr/local/etc/php.ini-recommended /usr/local/etc/php.ini
# chmod 644 /usr/local/etc/php.ini
# ee /usr/local/etc/php.ini

修改528行 include_path = “.:/usr/local/share/pear”

# ee /usr/local/etc/apache22/httpd.conf

第363行加入:
AddType application/x-httpd-php .php
AddType application/x-httpd-php-source .phps
修改219行:
<IfModule dir_module>
DirectoryIndex index.php index.html index.htm
</IfModule>

# mkdir -m 755 /usr/local/www/apache22/data/test
# ee /usr/local/www/apache22/data/test/info.php

<?php
phpinfo();
?>

# cd /usr/ports/databases/memcached && make install clean
# cd /usr/ports/databases/pecl-memcache && make install clean
# echo ‘memcached_enable=”YES”‘ >> /etc/rc.conf

# apachectl restart


免费在线记账服务,个人理财好帮手,小型企业财务管理工具。
http://www.keepaccounts.com/

UTF-8如何转Unicode?

先转一篇来参考.

什么是 Unicode?

历史上, 有两个独立的, 创立单一字符集的尝试. 一个是国际标准化组织(ISO)的 ISO 10646 项目, 另一个是由(一开始大多是美国的)多语言软件制造商组成的协会组织的 Unicode 项目. 幸运的是, 1991年前后, 两个项目的参与者都认识到, 世界不需要两个不同的单一字符集. 它们合并双方的工作成果, 并为创立一个单一编码表而协同工作. 两个项目仍都存在并独立地公布各自的标准, 但 Unicode 协会和 ISO/IEC JTC1/SC2 都同意保持 Unicode 和 ISO 10646 标准的码表兼容, 并紧密地共同调整任何未来的扩展.
什么是 UTF-8?

首先 UCS 和 Unicode 只是分配整数给字符的编码表. 现在存在好几种将一串字符表示为一串字节的方法. 最显而易见的两种方法是将 Unicode 文本存储为 2 个 或 4 个字节序列的串. 这两种方法的正式名称分别为 UCS-2 和 UCS-4. 除非另外指定, 否则大多数的字节都是这样的(Bigendian convention). 将一个 ASCII 或 Latin-1 的文件转换成 UCS-2 只需简单地在每个 ASCII 字节前插入 0x00. 如果要转换成 UCS-4, 则必须在每个 ASCII 字节前插入三个 0x00.

在 Unix 下使用 UCS-2 (或 UCS-4) 会导致非常严重的问题. 用这些编码的字符串会包含一些特殊的字符, 比如 ” 或 ‘/’, 它们在 文件名和其他 C 库函数参数里都有特别的含义. 另外, 大多数使用 ASCII 文件的 UNIX 下的工具, 如果不进行重大修改是无法读取 16 位的字符的. 基于这些原因, 在文件名, 文本文件, 环境变量等地方, UCS-2 不适合作为 Unicode 的外部编码.

在 ISO 10646-1 Annex R 和 RFC 2279 里定义的 UTF-8 编码没有这些问题. 它是在 Unix 风格的操作系统下使用 Unicode 的明显的方法.

UTF-8 有一下特性:

* UCS 字符 U+0000 到 U+007F (ASCII) 被编码为字节 0x00 到 0x7F (ASCII 兼容). 这意味着只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 两种编码方式下是一样的.
* 所有 >U+007F 的 UCS 字符被编码为一个多个字节的串, 每个字节都有标记位集. 因此, ASCII 字节 (0x00-0x7F) 不可能作为任何其他字符的一部分.
* 表示非 ASCII 字符的多字节串的第一个字节总是在 0xC0 到 0xFD 的范围里, 并指出这个字符包含多少个字节. 多字节串的其余字节都在 0x80 到 0xBF 范围里. 这使得重新同步非常容易, 并使编码无国界, 且很少受丢失字节的影响.
* 可以编入所有可能的 231个 UCS 代码
* UTF-8 编码字符理论上可以最多到 6 个字节长, 然而 16 位 BMP 字符最多只用到 3 字节长.
* Bigendian UCS-4 字节串的排列顺序是预定的.
* 字节 0xFE 和 0xFF 在 UTF-8 编码中从未用到.

下列字节串用来表示一个字符. 用到哪个串取决于该字符在 Unicode 中的序号.
U-00000000 – U-0000007F: 0xxxxxxx
U-00000080 – U-000007FF: 110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

xxx 的位置由字符编码数的二进制表示的位填入. 越靠右的 x 具有越少的特殊意义. 只用最短的那个足够表达一个字符编码数的多字节串. 注意在多字节串中, 第一个字节的开头”1″的数目就是整个串中字节的数目.

例如: Unicode 字符 U+00A9 = 1010 1001 (版权符号) 在 UTF-8 里的编码为:

11000010 10101001 = 0xC2 0xA9

而字符 U+2260 = 0010 0010 0110 0000 (不等于) 编码为:

11100010 10001001 10100000 = 0xE2 0x89 0xA0

这种编码的官方名字拼写为 UTF-8, 其中 UTF 代表 UCS Transformation Format. 请勿在任何文档中用其他名字 (比如 utf8 或 UTF_8) 来表示 UTF-8, 当然除非你指的是一个变量名而不是这种编码本身.
什么编程语言支持 Unicode?

在大约 1993 年之后开发的大多数现代编程语言都有一个特别的数据类型, 叫做 Unicode/ISO 10646-1 字符. 在 Ada95 中叫 Wide_Character, 在 Java 中叫 char.

ISO C 也详细说明了处理多字节编码和宽字符 (wide characters) 的机制, 1994 年 9 月 Amendment 1 to ISO C 发表时又加入了更多. 这些机制主要是为各类东亚编码而设计的, 它们比处理 UCS 所需的要健壮得多. UTF-8 是 ISO C 标准调用多字节字符串的编码的一个例子, wchar_t 类型可以用来存放 Unicode 字符.

这个问题已经解决了,这个问题主要是针对”CSV”的问题。

CSV

  • 导出数据为以”逗号分隔”的CSV文件,可以用 Microsoft Office Excel 打开。
  • 但 Microsoft 一向以”没头脑”著称,这次也不例外,因为导出的CSV文件是UTF-8的文件,Excel 打开时是乱码。麻烦你要先把CSV文件转换成 ANSI,如果你的操作系统是 WIN98 以上,直接用”记事本”打开另存为 ANSI 即可。
  • Microsoft 好象一向和 UTF-8 不和。
  • 具体的 CSV 文件如何操作,你自己去掌握吧。

解决问题的方法是:

CSV不支持”UTF-8″,但是支持”Unicode”,在WIN下我们测试将”.CSV”文件用”记事本”打开另存为 ANSI、Unicode,Microsoft Office Excel 都可以正确识别打开,UTF-8、Unicode big enbian却不行。

KeepAccounts.com是多语言的网站,ANSI编码不可取。Unicode是可以的。

Unicode是”UTF-16LE”,我可以通过:
mb_convert_encoding($str, “UTF-16LE”, “UTF-8”)
或者
iconv(“UTF-8”, “UTF-16LE”, $str)
将UTF-8转换为Unicode。

但是问题还没有解决,Microsoft Office Excel 打开转换为Unicode编码的”.CSV”文件却依然是乱码,为什么呢??

参考上篇文章我们可以得知,WIN可以识别UTF-8,却不能识别Unicode,所以要在头部加BOM,不知道什么是BOM吗??自己去搜索下就知道了。

实际我们在WIN里建立一个空的UTF-8编码的文本和Unicode编码的文本,还有ANSI编码的文本就会发现,都是空的文本,除了ANSI编码的是0字节,UTF-8编码的文本是3字节,Unicode编码的文本是2字节。这些就是BOM,就是WIN系统用来正确识别文本编码的信息。但是UTF-8编码的文本不用BOM,WIN也可以识别。Unicode编码的文本却不行,所以我开始就一直在这个问题上纠缠。知道了问题就可以解决问题了。不是没有BOM吗?那就自己加啊。Continue Reading