文件系统 - 文件类型 - 二进制/文本类型_二进制文件-程序员宅基地

技术标签: 源码文件  文本文件  文件系统-FILE SYSTEM  二进制文件  进制-BINARY SYSTEM  

1.应用场景

了解 二进制文件 / 文本文件 / 源码文件 的区别,理解文件存储,传输, 显示的过程,及本质

2.学习/操作

1.介绍

文件 - 介绍 含PEM文件_william_n的博客-程序员宅基地_pem是什么文件

1. 二进制文件 [Binary file]

计算机文件基本上分为二种:二进制文件 ASCII(也称纯文本文件),

图形文件及文字处理程序等计算机程序都属于二进制文件。// 所以常常可以听到下载的二进制可执行文件

这些文件[二进制文件]含有特殊的格式及计算机代码。

ASCII 则是可以用任何文字处理程序阅读的简单文本文件。


文本文件只是二进制文件中的一种特例。

为了与文本文件相区别,人们又把除了文本文件以外的文件称为二进制文件,由于很难严格区分文本文件和二进制文件的概念,所以我们可以简单地认为,如果一个文件专门用于存储文本字符的数据,没有包含字符以外的其他数据,我们就称之为文本文件,除此之外的文件就是二进制文件。

https://baike.baidu.com/item/二进制文件/996661?fr=aladdin

2. 纯文本文件 [Text file]

文本 由可打印字符组成,人可以直接阅读和理解其形式。

例如:

百科=百度百科、整数类型 甲变量。


纯文本并非意味着文本是无结构的;

标准通用标记语言[SGM或SGML]和HTMLXML都是有结构定义良好的的纯文本的好例子。

通过纯文本,你可以做你通过某种二进制格式所能做的每件事情,其中包括版本管理。

与直接的二进制编码相比,纯文本所处的层面往往更高;

前者[二进制文件]通常直接源自实现。

假定你想要存储叫做uses_menus的属性,其值既可为/true,也可为假/false。

使用纯文本,你可以将其写为:myprop.uses_menus=FALSE 把它与0010010101110101对比一下。

大多数二进制格式的问题在于,理解数据所必需的语境与数据本身是分离的。

你人为地使数据与其含义脱离开来。数据也可能加了密;没有应用逻辑对其进行解析,这些数据绝对没有意义。但是,通过纯文本,你可以获得自描述(self-describing)的、不依赖于创建它的应用的数据流

https://baike.baidu.com/item/二进制文件/996661?fr=aladdin

补充:

二进制文件, 跟存储方式[在硬盘上]没有关系。

即不是因为存储格式为二进制的关系, 而是这些文件 含有特殊的格式及计算机代码.

2. 存储

从本质上来说他们之间没有什么区别,因为他们在硬盘上都只有一种的存放方式 -- 二进制 即 01010101....

插入:

命名规则和数据类型 - Amazon DynamoDB

没有明白二进制数据的含义,本质,与二进制文件的区别? -- 20211118 周一

追加

baike.baidu.com/item/二进制数据/1715915?fr=aladdin

3. 传输

文件传输涉及到网络传输,当然不包括本机内文件拷贝。

如,FTP/TFTP协议.

个人此刻的想法「可能存在问题,望知晓」

本质上就是要序列化为二进制格式,在网络上传输,到了硬件层,就是高低电平的波动,

实际上并没有所谓的传输内容「字符串」在所谓的网络通道「物理上,就是有线和无线」中

接收端网卡监听高低电平的变化,然后反序列化成人类「开发人员」能看懂的字符串。

所以,网络传输过程中涉及到一个重要的步骤:

发送端:字符串 ---- 序列化--- 二进制流「只是比喻,TCP也是流式传输」/数据 

接收端:二进制流---- 反序列化---字符串

但是在编程中,通常还会有一个编程级别的序列化:

将数组,对象等变成字符串,然后继续上面的过程。

你可能会问,为什么要多这个步骤?

因为数组,对象等特殊的数据类型,是编程语言搞出来的东西,网络传输其实并不关心「不认识」,

当然,其实字符串起初也不认识,只是开发人员让网络传输认识「将各种数组类型转换为字符串」,

基本数据类型之间编程语言默认会进行序列化「而且也通常这样做就好了」

但是对于复杂数据类型,则需要开发人员自己去选择何种方式序列化,比如json, xml,protobuf等

然后就是字符串。重复上面的过程即可。

4. 读写

将文件从硬盘读取到内存中, 然后操作文件内容等, 最后写回磁盘.

此刻的想法 -- 待验证

文件内容存储在硬盘上,也是二进制的方式,也就是0,1的数字。

读取文件内容时,根据读到的二进制0,1转为人类可以看懂的字符。

写入则是相反,人类输入字符,计算机底层将字符转换为二进制格式的内容写入。

5. 显示

不论是文件I/O「输入输出」显示,还是网络I/O显示,本质上

都是一个接一个的转换过程,指只不过很快,同时将这个过程给隐藏了,对用户透明了,

所以使用的时候,好像就是直接一步到位,没有经过转换。

转换过程:

溯源,总要先有输入,才会有来的输出

比如:

键盘上输入一个a,实际上,是输入a代表的unicode value,但是经过计算机底层处理「硬件设备和软件设备」,将其转换为字符a,输出到了屏幕上「这涉及到屏幕定位,描绘等过程」。 整个过程好像你就是直接在屏幕上输了个a。

6. 本质

就是搭载信息的储存介质, 跟物理世界有关.   // 个人理解

计算机世界,本质上就两种资源:计算与存储

后续补充

...

3.问题/补充

1.安装软件时,总会听到下载源代码编译安装,或者 下载二进制文件直接安装?

到底有什么区别?

源代码方式 和 二进制包是软件包的两种形式。

二进制包里面包括了已经经过编译,可以马上运行的程序。

你只需要下载和解包(安装)它们以后,就马上可以使用。

源代码包里面包括了程序原始的程序代码,需要在你的计算机上进行编译以后才可以产生可以运行程序, 所以从源代码安装的时间会比较长。

source code 是程序员跑的代码, binary code 是机器跑的代码。

source code 得经过 compile 才能成為 binary code 。 

RPM 有分两种:

binary rpm 与 source rpm
前者是编好的 binary ,安裝就可用.
后者是还沒编好的 source ,需 rebuild「重建,重组」 之后才能安裝。

rpm格式很好区分,

二进制格式的包名字很长,都带有版本号、适应平台、适应的硬件类型等,

而源码格式仅仅就是一个版本号的tar包。

如下:

mysql-5.0.45.tar.gz 是源码包   

mysql-5.0.45-linux-x86_64-glibc23.tar.gz 是二进制包

如果你用过压缩工具就会明白,压缩包未必就是软件,它也可能是备份的许多图片,也可能是打包在一起的普通资料,要分辨它到底是什么最好的办法就是查看包里的文件清单,使用命令tar ztvf *. 或者tar ytvf *.bz2

源代码包里的文件往往会含有种种源代码文件,头文件*.h、c代码源文件*.c、C++代码源文件*.cc/*.cpp等;

而二进制包里的文件则会有可执行文件(与软件同名的往往是主执行文件),标志是其所在路径含有名为bin的目录(仅有少数例外)

2. tar包和tar.gz包有什么区别?

1、文件类型不同:

tar包属于打包文件,Unix和类Unix系统上的压缩打包工具,可以将多个文件合并为一个文件,打包后的文件后缀亦为“tar”。tar.gz包是压缩文件,经过gzip压缩后的tar文件,形成tar.gz包,扩展名为“.tar.gz”。

2、用途不同:

tar.gz包一般情况下都是源代码的安装包,需要先解压再经过编译、安装才能执行。

总而言之, 它是一个压缩文件。tar包最初的设计目的是将文件备份到磁带上(tape archive [磁带存档]),因而得名tar,一般用于文件备份。

补充:

tar里面的参数, 比如 z是针对 gzipj是针对 bzip2  //如下截图所示

补充:

tar里面没有针对xz格式的参数, 习惯了 tar czvf 或 tar xzvf 的人可能碰到 tar.xz也会想用单一命令搞定解压或压缩, 其实不行.

具体处理办法见下方3

3. tar.xz文件如何解压?

习惯了 tar czvf 或 tar xzvf 的人可能碰到 tar.xz也会想用单一命令搞定解压或压缩。其实不行 tar里面没有征对xz格式的参数比如 z是针对 gzip,j是针对 bzip2。

创建tar.xz文件 // 先打包, 再压缩.

只要先 tar cvf xxx.tar xxx/ 这样创建xxx.tar文件先,

然后使用 xz -z xxx.tar 来将 xxx.tar压缩成为 xxx.tar.xz

解压tar.xz文件// 先解压, 再解包  联想生活就知道, 顺序为什么如此.

先 xz -d xxx.tar.xz 将 xxx.tar.xz解压成 xxx.tar

然后,再用 tar xvf xxx.tar来解包。

4. 二进制安全

REDIS data-types-intro -- Redis中文资料站 -- Redis中国用户组(CRUG)

二进制安全是什么? - 知乎

 Redis data types | Redis

 

简单理解为:

输出任何字符串的形式都可以,原样输出,不会进行任何特殊处理。

是什么就是什么。

后续补充

...

4.参考

参见文档阅读列表

后续补充

...

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/william_n/article/details/103602428

智能推荐

2022黑龙江最新建筑八大员(材料员)模拟考试试题及答案_料账的试题-程序员宅基地

文章浏览阅读529次。百分百题库提供建筑八大员(材料员)考试试题、建筑八大员(材料员)考试预测题、建筑八大员(材料员)考试真题、建筑八大员(材料员)证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。310项目经理部应编制机械设备使用计划并报()审批。A监理单位B企业C建设单位D租赁单位答案:B311对技术开发、新技术和新工艺应用等情况进行的分析和评价属于()。A人力资源管理考核B材料管理考核C机械设备管理考核D技术管理考核答案:D312建筑垃圾和渣土._料账的试题

chatgpt赋能python:Python自动打开浏览器的技巧-程序员宅基地

文章浏览阅读614次。本文由chatgpt生成,文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型,只是展现它原本的实力。对于颠覆工作方式的ChatGPT,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。AI职场汇报智能办公文案写作效率提升教程 专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。_python自动打开浏览器

Linux中安装JDK-RPM_linux 安装jdk rpm-程序员宅基地

文章浏览阅读545次。Linux中安装JDK-RPM方式_linux 安装jdk rpm

net高校志愿者管理系统-73371,计算机毕业设计(上万套实战教程,赠送源码)-程序员宅基地

文章浏览阅读25次。免费领取项目源码,请关注赞收藏并私信博主,谢谢-高校志愿者管理系统主要功能模块包括页、个人资料(个人信息。修改密码)、公共管理(轮播图、系统公告)、用户管理(管理员、志愿用户)、信息管理(志愿资讯、资讯分类)、活动分类、志愿活动、报名信息、活动心得、留言反馈,采取面对对象的开发模式进行软件的开发和硬体的架设,能很好的满足实际使用的需求,完善了对应的软体架设以及程序编码的工作,采取SQL Server 作为后台数据的主要存储单元,采用Asp.Net技术进行业务系统的编码及其开发,实现了本系统的全部功能。

小米宣布用鸿蒙了吗,小米OV对于是否采用鸿蒙保持沉默,原因是中国制造需要它们...-程序员宅基地

文章浏览阅读122次。原标题:小米OV对于是否采用鸿蒙保持沉默,原因是中国制造需要它们目前华为已开始对鸿蒙系统大规模宣传,不过中国手机四强中的另外三家小米、OPPO、vivo对于是否采用鸿蒙系统保持沉默,甚至OPPO还因此而闹出了一些风波,对此柏铭科技认为这是因为中国制造当下需要小米OV几家继续将手机出口至海外市场。 2020年中国制造支持中国经济渡过了艰难的一年,这一年中国进出口贸易额保持稳步增长的势头,成为全球唯一..._小米宣布用鸿蒙系统

Kafka Eagle_kafka eagle git-程序员宅基地

文章浏览阅读1.3k次。1.Kafka Eagle实现kafka消息监控的代码细节是什么?2.Kafka owner的组成规则是什么?3.怎样使用SQL进行kafka数据预览?4.Kafka Eagle是否支持多集群监控?1.概述在《Kafka 消息监控 - Kafka Eagle》一文中,简单的介绍了 Kafka Eagle这款监控工具的作用,截图预览,以及使用详情。今天_kafka eagle git

随便推点

Eva.js是什么(互动小游戏开发)-程序员宅基地

文章浏览阅读1.1k次,点赞29次,收藏19次。Eva.js 是一个专注于开发互动游戏项目的前端游戏引擎。:Eva.js 提供开箱即用的游戏组件供开发人员立即使用。是的,它简单而优雅!:Eva.js 由高效的运行时和渲染管道 (Pixi.JS) 提供支持,这使得释放设备的全部潜力成为可能。:得益于 ECS(实体-组件-系统)架构,你可以通过高度可定制的 API 扩展您的需求。唯一的限制是你的想象力!_eva.js

OC学习笔记-Objective-C概述和特点_objective-c特点及应用领域-程序员宅基地

文章浏览阅读1k次。Objective-C概述Objective-C是一种面向对象的计算机语言,1980年代初布莱德.考斯特在其公司Stepstone发明Objective-C,该语言是基于SmallTalk-80。1988年NeXT公司发布了OC,他的开发环境和类库叫NEXTSTEP, 1994年NExt与Sun公司发布了标准的NEXTSTEP系统,取名openStep。1996_objective-c特点及应用领域

STM32学习笔记6:TIM基本介绍_stm32 tim寄存器详解-程序员宅基地

文章浏览阅读955次,点赞20次,收藏16次。TIM(Timer)定时器定时器可以对输入的时钟进行计数,并在计数值达到设定值时触发中断16位计数器、预分频器、自动重装寄存器的时基单元,在 72MHz 计数时钟下可以实现最大 59.65s 的定时,59.65s65536×65536×172MHz59.65s65536×65536×721​MHz不仅具备基本的定时中断功能,而且还包含内外时钟源选择、输入捕获、输出比较、编码器接口、主从触发模式等多种功能。_stm32 tim寄存器详解

前端基础语言HTML、CSS 和 JavaScript 学习指南_艾编程学习资料-程序员宅基地

文章浏览阅读1.5k次。对于任何有兴趣学习前端 Web 开发的人来说,了解 HTML、CSS 和JavaScript 之间的区别至关重要。这三种前端语言都是您访问过的每个网站的用户界面构建块。而且,虽然每种语言都有不同的功能重点,但它们都可以共同创建令人兴奋的交互式网站,让用户保持参与。因此,您会发现学习所有三种语言都很重要。如果您有兴趣从事前端开发工作,可以通过多种方式学习这些语言——在艾编程就可以参与到学习当中来。在本文中,我们将回顾每种语言的特征、它们如何协同工作以及您可以在哪里学习它们。HTML vs C._艾编程学习资料

三维重构(10):PCL点云配准_局部点云与全局点云配准-程序员宅基地

文章浏览阅读2.8k次。点云配准主要针对点云的:不完整、旋转错位、平移错位。因此要得到完整点云就需要对局部点云进行配准。为了得到被测物体的完整数据模型,需要确定一个合适的坐标系变换,将从各个视角得到的点集合并到一个统一的坐标系下形成一个完整的数据点云,然后就可以方便地进行可视化,这就是点云数据的配准。点云配准技术通过计算机技术和统计学规律,通过计算机计算两个点云之间的错位,也就是把在不同的坐标系下的得到的点云进行坐标变..._局部点云与全局点云配准

python零基础学习书-Python零基础到进阶必读的书藉:Python学习手册pdf免费下载-程序员宅基地

文章浏览阅读273次。提取码:0oorGoogle和YouTube由于Python的高可适应性、易于维护以及适合于快速开发而采用它。如果你想要编写高质量、高效的并且易于与其他语言和工具集成的代码,《Python学习手册:第4 版》将帮助你使用Python快速实现这一点,不管你是编程新手还是Python初学者。本书是易于掌握和自学的教程,根据作者Python专家Mark Lutz的著名培训课程编写而成。《Python学习..._零基础学pythonpdf电子书

推荐文章

热门文章

相关标签