项目手写操作系统中断

2023-10-11

Source

Edit

History

8259A 的编程

对 8259A 的编程就是对他的初始化，设置主片与从片的级联方式，指定起始中断向量号以及设置各种工作模式。

8259A 内部有两组寄存器，

一组是初始化命令寄存器组，用来保存初始化命令字（Initialization Command Words，ICW），ICW 共 4 个，ICW1 - ICW4。
另一组是操作命令寄存器组，用来保存操作命令字（Operation Command Words，OCW），OCW 共 3 个，OCW1 - OCW3

项目手写操作系统内存

2023-10-11

Source

Edit

History

7.获取物理内存容量

获取物理内存容量

linux 中获取物理内存容量是通过 BIOS 中断 0x15 实现，分别是 BIOS 中断 0x15 的 3 个子功能，子功能号要存放到寄存器 EAX 或 AX 中。如下：

EAX=0xE820 ：遍历主机上全部内存
AX=0xE801：分别检测低 15MB 和 16MB - 4GB 的内存，最大支持 4GB
AH=0x88：最多检测出 64MB 内存，实际内存超过此容量也按照 64MB 返回

项目手写操作系统boot-loader

2023-10-11

Source

Edit

History

Linux从开机加电到执行 main 函数之前的过程

从开机到 main 函数的执行分三步完成，其目的是实现从启动盘加载操作系统程序，完成执行 main 函数所需要的准备工作。

第一步，启动 BIOS，准备实模式下的中断向量表和中断服务程序

第二步，从启动盘加载操作系统程序到内存，加载操作系统程序的工作就是利用第一步中准备的中断服务程序实现的

第三步，为执行 32 位的 main 函数做过渡工作

一、启动 BIOS

Intel 将所有 80x86 系列的 CPU 的硬件都设计为加电即进入 16 位实模式状态运行。同时，将 CPU 硬件逻辑设计为加电瞬间强行将 CS 的值置为 0xFFFF，IP 的值置为 0x0000。这样 CS:IP 就指向 0xFFFF0 这个地址位置。

Monitor

量级：承载了 100w 左右的服务器和 2w多个视图的监控

二、工作经历

数据量：Monitor系统注册了100w 左右的服务器和 2w 多个视图

1. API模块的设计与开发

使用缓存作为数据库的中介，提高系统的性能和吞吐量；采用Cache-Aside Pattern的缓存更新策略，尽可能的保证缓存中的数据是最新的，同时也尽可能的解决缓存与数据库的数据不一致问题。针对写接口的限频，参考类似滑动时间窗口的限流算法，对于同一用户调用同一写接口的时间间隔必须大于一秒，做到最省成本且最大可能的保护系统的数据库负载不会太高。
查询接口的QPS：5w/s，资源占用：2C

缓存更新策略：【架构框架/release/缓存.md】（包括增删查改）。为什么不用 redis？用不起，成本高。

限流算法：滑动时间窗。两个统计周期部分重叠，从而避免短时间内的两个统计点分属不同的时间窗的情况。比如 0.00 - 1.00 分钟统计，0.30 - 1.30 分钟做统计，1.00 - 2.00 做统计【架构框架/极客-架构/高可用架构模式/应对接口级故障.md】

指标监控

一、架构组成

SDK -> TencentCloud_CloudMonitor_Agent -> 云监控接口机 -> kafka -> 指标计算（flink） -> Kafka -> writer 存储/告警

二、工作经历

数据量：云基础监控上报指标量8.3万亿/d，存储记录数8500亿/d
自定义监控上报记录数2200亿/d，存储记录数600亿/d

协议设计：窄表改造成宽表，业界著名监控系统prometheus、statsd等协议采用的是窄表（一张表一个指标）上报数据，通过在Tccm-SDK和Tccm-Agent支持窄表转换宽表（一张表多个指标），大幅降低了数据的上报流量。
性能：例如开源Flink自监控数据上报流量从10GB/m降至2GB/m

Tccm-Agent的设计与开发：调研分析了业界和公司内监控Agent的实现，最终采用微内核架构，面向功能进行拆分插件种类，分为输入、预处理、聚合、输出插件，以配置文件的方式实现插件注册机制进行插件管理，不同种类的插件之间通过线程安全队列进行连接通信，插件完全解藕，可扩展性强。且快速适配了prometheus、statsd、influx line protocol等开源协议上报数据的用户，可以方便的将不同的数据协议进行整理、统一格式且将数据聚合之后上报到云监控中台。
性能：Tccm-Agent可接收流量80M/s，占用资源CPU：2C，MEM：60M

Tccm-SDK的设计与开发：分析了开源界（prometheus、datadog、influxdb等）和公司内（007、monitor等）监控系统的SDK的上报协议和实现，采用宽表（一张表多个维度多个指标）作为数据流转或存储协议，以文本作为数据传输协议，实现线程安全的多写单读队列作为中介进行缓冲数据，定时读取数据进行聚合处理后上报到Tccm-Agent；功能上支持公司内部和开源界所有的数据统计方式；性能上每秒上报指标量可以达到百万级别，而其他SDK都只是在十万级别；并且支持多语言（go、c++、java等）
性能：SDK在不丢数据的情况下，最高可传输100w指标数每秒，流量70M/s，占用资源CPU：1.1C，MEM：100M

项目手写操作系统boot-loader

2023-10-11

Source

Edit

History

1.计算机的启动

计算机的启动

在开机的一瞬间，也就是接电的一瞬间，CPU 的 cs:ip 寄存器被强制初始化为 OxF000:0xFFF0。由于开机的时候处于实模式，在实模式下的段基址要乘以 16，也就是左移 4 位，于是 0xF000:0xFFF0 的等效地址将是 0xFFFF0。这个地址就是 BIOS 的入口地址。

一、BIOS

BIOS 的全称 Base Input & Output System，即基本输入输出系统。

实模式下的内存布局如下：

项目手写操作系统boot-loader

2023-10-11

Source

Edit

History

2.写一个 MBR 程序

写一个 MBR 程序

我们先来贴出程序，然后再来解释。如下这段代码的功能是在屏幕上打印字符串 “1 MBR”。背景色为黑色，前景色为绿色。

;主引导程序 
;------------------------------------------------------------
SECTION MBR vstart=0x7c00         
   mov ax,cs      
   mov ds,ax
   mov es,ax
   mov ss,ax
   mov fs,ax
   mov sp,0x7c00

; 清屏 利用0x06号功能，上卷全部行，则可清屏。
; -----------------------------------------------------------
;INT 0x10   功能号:0x06	   功能描述:上卷窗口
;------------------------------------------------------
;输入：
;AH 功能号= 0x06
;AL = 上卷的行数(如果为0,表示全部)
;BH = 上卷行属性
;(CL,CH) = 窗口左上角的(X,Y)位置
;(DL,DH) = 窗口右下角的(X,Y)位置
;无返回值：
   mov     ax, 0x600
   mov     bx, 0x700
   mov     cx, 0           ; 左上角: (0, 0)
   mov     dx, 0x184f	   ; 右下角: (80,25),
			   ; VGA文本模式中,一行只能容纳80个字符,共25行。
			   ; 下标从0开始,所以0x18=24,0x4f=79
   int     0x10            ; int 0x10

;;;;;;;;;    下面这三行代码是获取光标位置    ;;;;;;;;;
;.get_cursor获取当前光标位置,在光标位置处打印字符.
   mov ah, 3		; 输入: 3号子功能是获取光标位置,需要存入ah寄存器
   mov bh, 0		; bh寄存器存储的是待获取光标的页号

   int 0x10		; 输出: ch=光标开始行,cl=光标结束行
							; dh=光标所在行号,dl=光标所在列号

;;;;;;;;;    获取光标位置结束    ;;;;;;;;;;;;;;;;

;;;;;;;;;     打印字符串    ;;;;;;;;;;;
   ;还是用10h中断,不过这次是调用13号子功能打印字符串
   mov ax, message 
   mov bp, ax		; es:bp 为串首地址, es此时同cs一致，
								; 开头时已经为sreg初始化

   ; 光标位置要用到dx寄存器中内容,cx中的光标位置可忽略
   mov cx, 5			; cx 为串长度,不包括结束符0的字符个数
   mov ax, 0x1301	; 子功能号13是显示字符及属性,要存入ah寄存器,
									; al设置写字符方式 ah=01: 显示字符串,光标跟随移动
   mov bx, 0x2		; bh存储要显示的页号,此处是第0页,
									; bl中是字符属性, 属性黑底绿字(bl = 02h)
   int 0x10				; 执行BIOS 0x10 号中断
;;;;;;;;;      打字字符串结束	 ;;;;;;;;;;;;;;;

   jmp $		; 使程序悬停在此

   message db "1 MBR"
   times 510-($-$$) db 0
   db 0x55,0xaa

1. section 相关

section 是伪指令，是 nasm 提供的。CPU 运行程序是不需要这个东西的，section 只是用来给程序员规划程序用的，逻辑上划分成段的好处就是方便开发人员梳理代码，方便管理。

如果没有定义 section，nasm 默认全部代码同为一个 section，起始位置为 0。

1. 最近遇到有挑战的事情？怎么解决？难度最大。工作中遇到最难解决的问题？怎么解决

刚毕业那会自己写的代码太菜，经常被气哭，上线后很多问题，架构不合理（多 worker、多 sender），很多东西没有注意到（go 中 recover），API 接口设计没有考虑到用户使用。没有做足准备（已经有的实现，而是自己想、自己做），这是 2020 年的状况

看公司内源代码（polaris、trpc等），看外界源码（prometheus、statsd、influxdb、telegraf）等、请教大佬，codereview 我的代码

看架构设计，代码整洁之道。对工作中遇到的场景先想想应该如何做架构，然后再看成熟的架构。

写代码前先做好充足的调研，然后列出自己要做什么，那里会有问题，卡点。业界采用的什么方案，我采用什么方案？有什么优缺点？

写代码时做好充分的单元测试，对于模块做好功能测试、性能测试。写完之后再整体审核下架构是否需要做调整？

项目手写操作系统boot-loader

2023-10-11

Source

Edit

History

9.加载内核

加载内核

程序猿实现的一段代码，比如下：

1	int main(void) { while(1); }

我们首先将他编译成一个可重定位文件，也就是 .o 文件。使用：gcc -c -o main.o main.c

此时，目标文件（可重定位文件）中的符号（变量、函数名）的地址没有确定（可以使用 nm 查看）。我们使用 ld 进行链接，可以使用参数：-Ttext 来指定最终生成的可执行文件的起始虚拟地址。如：ld main.o -Ttext 0xc0001500 -e main -o kernel.bin

算法

三数之和

https://leetcode-cn.com/problems/3sum/
删除字符串里面的 n 个数字来得到最小数字