系統服務
北京中亦安圖科技股份有限公司(簡稱:中亦科技)是國內領先的 IT 基礎架構智能運維服務 + 產品提供商,在傳統架構和開放云架構中都擁有成熟的解決方案和豐富的運維經驗。在操作系統運維方面,中亦科技擁有豐富的經驗和完善的技術支持能力。能夠提供操作系統體系咨詢、規劃、實施、運維管理、應急、性能調優等全生命周期服務。
◆目前中亦科技為客戶維護操作系統分區數量超過 10000 多套;
◆擁有強大的綜合技術實力,多名專家曾服務于 Oracle、IBM 等原廠商,能為客戶提供總行級的系統運維服務;
◆客戶涵蓋銀行、證券、基金、保險、通信、政府、能源、制造等眾多行業。
AIX 系統運維服務
服務分類:

服務內容:
AIX 深度健康檢查

監控最佳實踐

補丁分析及建議服務

性能調優服務

架構設計:PowerVM- 推薦架構


系統單點分析
對客戶系統架構梳理,分析硬件軟件對于業務系統的影響,發現了系統中的組件單點,并提出改進建議,通過對架構的優化,提高系統的高可用性,保證了系統的穩定運行。

安全加固
(1)賬號管理、認證授權
賬號管理:賬號安全控制標準、密碼安全策略、登錄策略配置、用戶環境變量配置
認證授權:設置關鍵目錄的權限、修改 umask 值、FTP 用戶及服務安全、設置目錄權限、主機信任關系設置
(2)日志配置要求:啟用日志記錄功能、syslog 日志等級的安全配置、啟用記錄 su 日志功能、啟用記錄 cron 行為日志功能和 cron/at 的使用情況
(3)系統穩定保障設置:系統備份恢復、通訊安全控制、系統資源安全訪問控制、系統監控
(4)系統基礎安裝:系統配置標準、系統架構標準、系統軟件安裝標準、 系統補丁安裝標準
(5)服務啟??刂疲宏P閉無效服務和啟動項、系統網絡與服務安全配置標準
技術交流與培訓

系統運維工具產品:
操作系統健康檢查工具

HA 一致性檢查工具

客戶收益
◆每天只需打開郵箱,就可以看到巡檢結果,大大提升工作效率
◆自動分析工具中的巡檢內容已經融合了系統專家的最佳巡檢實踐,使用該工具等于直接借鑒和使用系統運維專家的經驗
◆不定期加入中亦科技在其他客戶處實踐過的有價值的巡檢項,將保護用戶的投資最大化
◆支持個性化定制,保證用戶維護習慣的延續
◆提升運維效率
系統上線前檢查工具
◆ 定制化及標準化系統安裝配置項檢查
◆ 自動比對參數配置是否正確
◆ 基于配置標準,提出配置建議
◆ 定義配置項的風險級別

LINUX 系統運維服務
服務分類:

服務內容:


高級運維服務內容——系統安全加固
服務說明:
為了客戶系統運行的安全穩定,解決客戶生產環境中系統存在安全漏洞,避免系統不良入侵與訪問。規范客戶Linux 操作系統,提高系統安全性,促進操作系統安全加固標準化作業,確保業務系統的安全、可靠運行,中亦科技提供 Linux 操作系統安全加固服務。
服務細則:
●加固實施流程
●加固細項內容
● 加固腳本
實施流程:

詳細內容(部分)


加固腳本(部分)

高級運維服務內容——Kdump分析
服務介紹:
中亦科技為客戶提供 linux 系統 kdump 分析服務,當主機由于軟件或硬件原因導致系統崩潰, 系統一般都會把崩潰前內存鏡像保存下來生成轉儲文件,通過分析轉儲文件獲取內核崩潰原因。kdump 是一種基于 kexec 的 Linux 內核崩潰捕獲機制,將 kernel 崩潰前的內存鏡像保存,中亦客戶二線、三線專家通過分析該文件找出 kernel 崩潰的原因,從而避免再次出現計劃外的宕機。
服務細項:
●kdump原理說明
●啟用Kdump
●kdump分析
● 完成kdump分析報告
服務流程:

啟用Kdump:
確??蛻舨僮飨到y啟用 kdump,當主機發生 crash 或內核崩潰會生成內核轉儲文件。為了保證所有 linux 系統啟用 kdump,現場工程師會根據官方步驟逐一檢查維護主機確保啟用 kdump。
下面為檢查和啟用 kdump 步驟:
● 確??蛻粝到y安裝kexec-tools包
確認rpm -q kexec-tools
安裝yum install kexec-tools
● 添加啟動參數
在 /boot/grub/grub.conf 里面添加crashkernel 選項
RHEL 6 i386 and x86_64 系統使用crashkernel=128
● 啟動 kudmp 服務
chkconfig kdump on
service kdump start
kdump 分析:
● kdump 轉儲文件文件分析工具 crash 介紹
當 Linux 系統內核發生崩潰的時候,可以通過 kdump 等方式收集內核崩潰之前的內存,生成一個轉儲文件vmcore,二線專家通過分析該 vmcore 文件就可以診斷出內核崩潰的原因。crash 就是一個被廣泛使用的內核崩潰轉儲文件分析工具
● kdump分析工具
kexec-tools是kdump分析工具
kernel-debuginfo調試kdump生成的vmcore 文件
確保kexec-tools kernel-default-debuginfo kernel -debuginfo三個軟件包安裝
● 啟動 crash
crash /usr/lib/debug/lib/modules/2.6.32-220.el6.ppc64/vmlinux vmcore
● 完成 kdump 分析報告
高級運維服務內容——漏洞修復和補丁管理
服務內容:
中亦科技將定期分析紅帽和 suse 廠商提供的補丁,對可能遇到的高風險補丁做出分析總結,同時羅列出了廠商官網給出的關于安全性的高風險補丁,評估這些補丁對現有基線版本的可能影響程度。
中亦科技根據多年運維的積累,形成了非常完善的補丁分析方法,概括補丁分析的過程及方法如下:
●定期收集原廠商補丁更新情況
●分析新發布補丁針對 bug 的修復情況,著重對其中高危補丁進行詳細分析,并制定解決方案
●客戶當前環境補丁情況統計及分析
●客戶既有環境觸發的 bug 情況統計
●中亦科技運維的其他客戶補丁問題借鑒案例
●綜合分析客戶當前環境的補丁情況,進行兼容性、可行性分析,并給出建議
服務細項:
●漏洞獲取、測試、和安裝步驟
●現有平臺主要高危漏洞
漏洞獲取、測試、發布和安裝步驟:
●對漏洞補丁的獲得途徑進行嚴格管理:系統補丁必須通過正式的方式從可信的供貨商(或廠商)獲得;
●漏洞補丁測試:
◆明確補丁測試的職能部門和測試流程;
◆對補丁進行嚴格的測試,測試內容包括與現有系統的兼容性測試;
◆測試內容必須包括回退測試;
◆測試方式包括:開發環境測試、壓力環境測試、模擬生產環境測試等;
●漏洞補丁安裝:
◆必須采用可回退安裝方式,并在正常試用一個月后將補丁正式提交(COMMIT);
◆版本升級前必須做系統全備份,可能的話建議同時做生產數據的全備份。
高級運維服務內容——復雜故障處理
服務說明:
中亦科技通過整合公司資源和原廠資源,對于客戶出現疑難問題、復雜問題,提供一套標準流程,確保問題可以盡快得到解決。
復雜故障處理流程:
● 出現問題首先現場工程師和硬件工程師確定是否為硬件問題
● 如果硬件問題協調客戶更換硬件應用
● 如果無硬件報錯升級公司二線專家
● 分析是否為性能問題
● 如果不是性能問題,收集 sosreport 或 supportconfig
● 通過 sosreport 或 supportconfig 日志分析主機出現故障原因
● 如果無法判斷進一步分析 dump 日志
● dump 無法分析出故障升級 case 到公司三線專家


高級運維服務內容——安裝配置標準化
服務說明:
根據中亦最近運維實踐,推薦系統版本基線,并制定標準化統一安裝配置手冊。針對特定環境,推薦系統調整參數清單及最佳實踐設置。
● 操作系統級別參數調整
● 操作系統用戶跟文件系統規劃
● 關聯軟件參數配置
● 根據需要,在特定環境下個性化參數修改
● 調整及優化配置參數
高級系統運維服務內容——監控最佳實踐
服務說明:
中亦科技根據多年積累,形成了非常完善的監控體系,可幫助客戶大幅提升監控覆蓋率。
監控的主要維度:
● 對系統性能相關的監控,如 CPU、內存、IO、磁盤等;
● 對文件系統使用情況的監控;
● 對進程、換頁、內核的監控等;
● 日志文件、報警的監控等;
● HA 狀態和報錯


高級系統運維服務內容——rhcs集群
服務說明:
我方將提供 rhcs 集群的安裝配置、故障解決及版本升級的各方面現場技術支持,并可定期組織對客戶的高可靠性軟件進行檢查,制定日常的維護標準和策略,保證高可用軟件的可用性,實現更短的宕機時間。
服務細則:
● 安裝配置:解決用戶在安裝配置時遇到的疑問,協助業務代理腳本的測試,保障 HA 的正常運行。
● 故障解決:分析 RHCS 集群運行過程中出現的各種故障和異常,查找問題原因,并予以徹底解決。
● 版本升級:在服務內,我們及時跟蹤 RHCS 集群的重要補丁及升級包,及時提出升級建議,在同客戶協商后進行 RHCS 集群的升級工作。
對雙機軟件進行安裝升級與維護服務,以確保在發生故障的情況下保證備份機能夠正常接管生產機的工作。
主要內容如下:
● 提供高可用集群軟件方案規劃設計服務;
● 提供高可用性軟件集群方案實施服務;
● 實施安裝完成后,提供高可用集群軟件實施文檔資料;
● 根據要求,提供高可用性軟件日常維護管理手冊;
● 對集群版本升級的計劃及準備提供建議;
● 在新版本集群軟件上調試系統配置并整合用戶數據;
● 對已安裝的新版本集群軟件進行測試及確定其基本功能;
● 更具應用需求,將指定應用系統添加到高可用性軟件中;
● 配置快照文件和應用啟動 / 關閉的腳本文件;
● 根據系統的改動,修改集群軟件軟件的資源與配置;
● 對新版本、升級和修改后的集群高可用性軟件進行功能測試;
● 對貴方在使用高可用性軟件過程中遇到的疑難問題提供服務支持;
● 定期的系統備份;
● 跟蹤廠商集群軟件技術發展,及時與客戶相關技術人員進行技術交流;
● 雙機軟件切換測試。