将MySQL的作为文件系统使用

来源:Asp之家 时间:2011-12-14 18:34:26 

利用MySQLfs这个工具,我么可以在MySQL关系数据库中存储文件系统。MySQLfs将文件系统中文件的字节内容分解成数据库中的元组,而数据库并不需要支持BLOB超大字段类型。利用MySQLfs,我们可以将一个文件系统直接扔到MySQL数据库中,并可以利用数据库的备份,集群和复制等功能来保护MySQLfs文件系统。
  MySQLfs似乎并不为Fedora, openSUSE, 或Ubuntu等系统提供二进制包,所以你必须编译它的源文件。为了编译MySQLfs,我们必须先安装mysql-devel和fuse-devel包(FUSE可以让任何应用程序通过LINUX内核访问文件系统,这意味着你可以立即用任意的应用程序来使用FUSE文件系统)。如果你丢失了一些devel包,配置时将会遇到一些比较麻烦的问题。举例来说,在我的Fedora 8 64位机上,刚开始因为找不到FUSE开发包,我无法通过mysqlclient_r链接;找不到FUSE开发包这个错误将在链接标签中生成一个单独的 –L,从而导致链接mysql客户端测试程序失败。另外,编译将默认使用-Wall,-Werror,在开始产生警告时也会导致编译失败。因此,我们可以不使用-Werror,并确保需要的所有包都已经安装等方式来解决编译问题。一但成功编译source,make install命令将把MySQLfs默认安装到目录/usr/local/bin下。
  下面的命令可以通过MySQLfs来创建一个MySQL数据库。
  注意:make install命令在默认情况下并没有将schema.sql安装到你的计算机上,你必须将schema复制到某个位置,以方便以后建立其他的MySQLfs数据库。
  # mysql -p
  mysql> CREATE DATABASE mysqlfs;
  mysql> GRANT SELECT, INSERT, UPDATE, DELETE ON mysqlfs.* TO mysqlfs@"%" IDENTIFIED BY 'foobar';
  mysql> FLUSH PRIVILEGES;
  mysql> Bye
  # mysql -uroot -p mysqlfs < /tmp/mysqlfs-0.4.0-rc1/schema.sql
  该数据库模式包含3个表:tree、inodes和data_blocks。tree表将一个节点inode映射到其父节点,下图将显示部分表的内容。
  在下面显示的模式中,我通过路径guten/alice13a.txt导入了一个文件。文件系统的命名层次结构是在树表中表示的,the alice13a.txt这个文件被存放到guten目录下,guten目录是在MySQLfs文件系统根目录下创建的。inode表包含了所有的信息,这些信息可以被start(2)调用。Data_blocks表用来村存储实际的文件字节内容。
  mysql> select * from tree;
  +-------+--------+----------------------+
  | inode | parent | name |
  +-------+--------+----------------------+
  | 1 | NULL | / |
  | 2 | 1 | guten |
  | 3 | 2 | alice13a.txt |
  ...
  mysql> select * from inodes;
  +-------+-------+---------+-------+-----+-----+------------+------------+------------+----------+
  | inode | inuse | deleted | mode | uid | gid | atime | mtime | ctime | size |
  +-------+-------+---------+-------+-----+-----+------------+------------+------------+----------+
  | 1 | 0 | 0 | 16877 | 0 | 0 | 1201155861 | 1201155861 | 1201155861 | 0 |
  | 2 | 0 | 0 | 16888 | 500 | 500 | 1200108244 | 1200108244 | 1201156234 | 0 |
  | 3 | 0 | 0 | 33184 | 500 | 500 | 1200108239 | 1200108239 | 1201156234 | 153477 |
  ...
  mysql> describe data_blocks;
  +-------+------------------+------+-----+---------+-------+
  | Field | Type | Null | Key | Default | Extra |
  +-------+------------------+------+-----+---------+-------+
  | inode | bigint(20) | NO | PRI | | |
  | seq | int(10) unsigned | NO | PRI | | |
  | data | blob | YES | | NULL | |
  +-------+------------------+------+-----+---------+-------+

因为FUSE可以让你以任何奇怪的方式安装文件系统,理所当然地,用户安装FUSE客户端文件系统的能力也必须受到用户所在组权限的限制。下面是一个例子,在一开始,用户没有安装文件系统的权限,被拒绝安装。然后,我将自己加入到相应的用户组后重新登录,初始的MySQLfs文件系统和数据库都是空的,使用df命令可以显示内核已经知道被安装的文件系统。在例子的结尾,fusermount命令将用户创建的FUSE文件系统卸载了。
  $ mkdir ~/mysqlfs
  $ mysqlfs -ohost=localhost -odatabase=mysqlfs ~/mysqlfs
  * Opening logfile 'mysqlfs.log': OK
  fuse: failed to open /dev/fuse: Permission denied
  $ su -l
  root# usermod -a -G fuse ben
  root# exit
  $ exit
  ...
  $ id
  uid=500(ben) gid=500(ben) groups=492(fuse), ...
  $ mysqlfs -ohost=localhost -odatabase=mysqlfs ~/mysqlfs
  * Opening logfile 'mysqlfs.log': OK
  $ ls -ld mysqlfs
  drwxr-xr-x 1 root root 0 2008-01-24 16:24 mysqlfs
  $ df -h mysqlfs .
  Filesystem Size Used Avail Use% Mounted on
  mysqlfs 0 0 0 - /home/ben/mysqlfs
  /dev/sdc3 16G 4.4G 11G 31% /home
  $ ls -l mysqlfs
  total 0
  $ fusermount -u mysqlfs
  既然我们已经拥有权限,可以将MySQL安装为FUSE文件系统,接下来,让我们复制一些文件到MySQL数据库中,使之与文件系统相结合。在下面的例子中,我将项目Gutenberg的一些文本文件复制到MySQLfs并验证它们在读取的时候,与原始文件有同样的MD5返回值。然后,我将Linux文件tarbar复制到MySQLfs,想看看MySQLfs是如何处理一个44M文件的。
  通过冷磁盘高速缓存将内核从/tmp目录备份到/tmp目录需要花2秒,而将之复制到MySQLfs将花费20秒,为了利用磁盘中的缓存,马上将上述操作再次执行,/tmp目录下的备份花费0.3秒,而复制到MySQLfs中依旧花费20秒。这说明,写操作是MySQLfs的主要瓶颈。当读取内核的时候,MySQLfs似乎缓存了一些数据,这使得响应时间大大快于其他测试。如果你的文件系统经常用到读操作,则MySQLfs将是一个有意思的选择,因为MySQLfs的缓存可以派上用场。
~]$ cp -av /.../guten ./mysqlfs/
`/.../guten' -> `./mysqlfs/guten'
`/.../guten/alice13a.txt' -> `./mysqlfs/guten/alice13a.txt'
`/.../guten/boysw10.txt' -> `./mysqlfs/guten/boysw10.txt'
`/.../guten/dmoro11.txt' -> `./mysqlfs/guten/dmoro11.txt'
~]$ cd ~/mysqlfs/guten
guten]$ ls -l
-rw-r----- 1 ben ben 153477 2008-01-12 13:23 alice13a.txt
-rw-rw---- 1 ben ben   48923 2008-01-12 13:23 boysw10.txt
-rw-rw---- 1 ben ben 259214 2008-01-12 13:23 dmoro11.txt
guten]$ md5sum *
135e06ad31b169065bccbf03ec7236f2   alice13a.txt
7dd30f1b37e32cdb5d21fe992bbf248d   boysw10.txt
87c05f11193c0e05b3d0dec0808a0450   dmoro11.txt
guten]$ md5sum /.../guten/*
135e06ad31b169065bccbf03ec7236f2   /.../guten/alice13a.txt
7dd30f1b37e32cdb5d21fe992bbf248d   /.../guten/boysw10.txt
87c05f11193c0e05b3d0dec0808a0450   /.../guten/dmoro11.txt
guten]$ cd ..
mysqlfs]$ time cp /tmp/linux-2.6.23.tar.bz2 .
real     0m16.278s
user     0m0.006s
sys      0m0.531s
mysqlfs]$ time cat linux-2.6.23.tar.bz2   >/dev/null
real     0m0.502s
user     0m0.004s
sys      0m0.035s
mysqlfs]$ time dd if=linux-2.6.23.tar.bz2 of=/tmp/junk bs=1024 count=1024
1048576 bytes (1.0 MB) copied, 0.0200973 s, 52.2 MB/s
 
real     0m0.058s
user     0m0.003s
sys      0m0.013s
mysqlfs]$ time dd if=linux-2.6.23.tar.bz2 of=/tmp/junk bs=1024 count=1024 skip=9000
1048576 bytes (1.0 MB) copied, 0.0214207 s, 49.0 MB/s
 
real     0m0.031s
user     0m0.001s
sys      0m0.011s
  虽然被很多人所不齿,但我还是决定在Bonnie++文件系统下使用MySQLfs。我通过虚拟机进行了这些测试,由于是在虚拟机中,性能可能会呈线性下降,但由于MySQL数据库和/tmp目录存储于同一虚拟硬盘上,其性能比还是有效的。
  在如下的结果中,你能看到,在运行Bonnie++ (version 1.03a-7)时,MySQLfs的速度是/tmp/bonnie (ext3)的十分之一。这说明,我们并不太想使用MySQLfs来直接存储邮件目录。Bonnie++被设计成适合在本地内核文件系统上工作而非FUSE,这种定位非常适用于大行文件的读写。
$ /usr/sbin/bonnie++ -d /tmp/bonnie 
        
        
       Version
           1.03
                ------Sequential Output------ --Sequential Input- --Random-
         
       
               
                      -Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
         
       Machine
                 Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP
           /sec %CP
         
       v8tsrv
                    2G 18155
           31 16726
            5 13338
            6 26207
           46 74527
           24
           9840 144
         
       
                             ------Sequential Create------ --------Random Create--------
         
       
                             -Create-- --Read--- -Delete-- -Create-- --Read--- -Delete--
         
       
                       files
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
         
       
                          16 24878
           94 +++++ +++ +++++ +++ 29018
           99 +++++ +++ +++++ +++
         
       
        
       $ /usr/sbin/bonnie++ -d ~/mysqlfs/bonnie
         
       
        
       Version
           1.03
                ------Sequential Output------ --Sequential Input- --Random-
         
       
                             -Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
         
       Machine
             
            Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP
           /sec %CP
         
       v8tsrv
                    2G
           2615
            5
           1207
            1
           1323
            1
           2143
            2
           2363
            0 138.1
            0
         
       
                             ------Sequential Create------ --------Random Create--------
         
       
                             -Create-- --Read--- -Delete-- -Create-- --Read--- -Delete--
         
       
                       files
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
           /sec %CP
         

        
                          16
            186
            2
            505
            1
            296
            2
            209
            2
            441
            1
            282
            2
        


标签:mysql,文件
0
投稿

猜你喜欢

  • 浅谈python配置与使用OpenCV踩的一些坑

    2022-10-12 07:16:26
  • 浅谈python中统计计数的几种方法和Counter详解

    2023-02-22 12:24:01
  • Python中非常实用的Math模块函数教程详解

    2022-12-08 02:12:49
  • 原生Javascript插件开发实践

    2024-04-17 09:43:45
  • python操作mongodb根据_id查询数据的实现方法

    2023-04-04 23:12:28
  • 微信小程序实现点击导航标签滚动定位到对应位置

    2024-05-10 13:59:17
  • python调试工具Birdseye的使用教程

    2023-08-22 19:18:48
  • python使用正则筛选信用卡

    2021-03-10 14:06:47
  • mysql主键,外键,非空,唯一,默认约束及创建表的方法

    2024-01-17 18:18:06
  • Python详细讲解图像处理的而两种库OpenCV和Pillow

    2022-08-14 05:23:19
  • 浅谈Python NLP入门教程

    2021-04-18 14:45:53
  • python tornado使用流生成图片的例子

    2023-08-24 07:07:20
  • 对python pandas 画移动平均线的方法详解

    2023-11-16 04:21:33
  • python中执行smtplib失败的处理方法

    2023-03-31 17:41:35
  • 利用Python正则表达式过滤敏感词的方法

    2023-05-07 05:05:18
  • Python深度学习pytorch神经网络多输入多输出通道

    2022-05-10 11:10:06
  • 关于Vue代码可读性的几点建议

    2024-05-13 09:08:09
  • 带农历及节日的js日历源码

    2010-08-01 17:38:00
  • python机器学习基础K近邻算法详解KNN

    2024-01-01 05:44:57
  • mysql 8.0.12 安装配置图文教程

    2024-01-13 20:12:04
  • asp之家 网络编程 m.aspxhome.com