added read_cpuid and MTRR support checking before trying to set them
[retrobench] / src / dos / gfx.c
1 #include <stdlib.h>
2 #include <string.h>
3 #include <dos.h>
4 #include "cdpmi.h"
5 #include "gfx.h"
6 #include "vbe.h"
7 #include "vga.h"
8 #include "util.h"
9
10
11 #define SAME_BPP(a, b)  \
12         ((a) == (b) || ((a) == 16 && (b) == 15) || ((a) == 15 && (b) == 16) || \
13          ((a) == 32 && (b) == 24) || ((a) == 24 && (b) == 32))
14
15 void (*blit_frame)(void*, int);
16
17 int resizefb(int x, int y, int bpp, int pitch);
18
19 static void blit_frame_lfb(void *pixels, int vsync);
20 static void blit_frame_banked(void *pixels, int vsync);
21 static uint32_t calc_mask(int sz, int pos);
22
23 static void enable_wrcomb(uint32_t addr, int len);
24 static void print_mtrr(void);
25
26 static struct video_mode *vmodes;
27 static int num_vmodes;
28
29 static int vbe_init_ver;
30 static struct vbe_info vbe;
31
32 /* current mode */
33 static struct video_mode *curmode;
34 static void *vpgaddr[2];
35 static int frontidx, backidx;
36 static int pgcount, pgsize, fbsize;
37
38
39 int init_video(void)
40 {
41         int i, num, max_modes;
42         struct video_mode *vmptr;
43
44         if(vbe_info(&vbe) == -1) {
45                 fprintf(stderr, "failed to retrieve VBE information\n");
46                 return -1;
47         }
48         vbe_print_info(stdout, &vbe);
49
50         num_vmodes = 0;
51         max_modes = 64;
52         if(!(vmodes = malloc(max_modes * sizeof *vmodes))) {
53                 fprintf(stderr, "failed to allocate video modes list\n");
54                 return -1;
55         }
56
57         num = vbe_num_modes(&vbe);
58         for(i=0; i<num; i++) {
59                 struct vbe_mode_info minf;
60
61                 if(vbe_mode_info(vbe.modes[i], &minf) == -1) {
62                         continue;
63                 }
64
65                 if(num_vmodes >= max_modes) {
66                         int newmax = max_modes ? (max_modes << 1) : 16;
67                         if(!(vmptr = realloc(vmodes, newmax * sizeof *vmodes))) {
68                                 fprintf(stderr, "failed to grow video mode list (%d)\n", newmax);
69                                 free(vmodes);
70                                 return -1;
71                         }
72                         vmodes = vmptr;
73                         max_modes = newmax;
74                 }
75
76                 vmptr = vmodes + num_vmodes++;
77                 memset(vmptr, 0, sizeof *vmptr);
78                 vmptr->mode = vbe.modes[i];
79                 vmptr->xsz = minf.xres;
80                 vmptr->ysz = minf.yres;
81                 vmptr->bpp = minf.bpp;
82                 vmptr->pitch = minf.scanline_bytes;
83                 if(minf.mem_model == VBE_TYPE_DIRECT) {
84                         vmptr->rbits = minf.rsize;
85                         vmptr->gbits = minf.gsize;
86                         vmptr->bbits = minf.bsize;
87                         vmptr->rshift = minf.rpos;
88                         vmptr->gshift = minf.gpos;
89                         vmptr->bshift = minf.bpos;
90                         vmptr->rmask = calc_mask(minf.rsize, minf.rpos);
91                         vmptr->gmask = calc_mask(minf.gsize, minf.gpos);
92                         vmptr->bmask = calc_mask(minf.bsize, minf.bpos);
93                         /*vmptr->bpp = vmptr->rbits + vmptr->gbits + vmptr->bbits;*/
94                 }
95                 if(minf.attr & VBE_ATTR_LFB) {
96                         vmptr->fb_addr = minf.fb_addr;
97                 } else {
98                         vmptr->bank_size = (uint32_t)minf.bank_size * 1024;
99                         if(!vmptr->bank_size) {
100                                 vmptr->bank_size = 65536;
101                         }
102                 }
103                 vmptr->max_pages = minf.num_img_pages;
104
105                 printf("%04x: ", vbe.modes[i]);
106                 vbe_print_mode_info(stdout, &minf);
107         }
108         fflush(stdout);
109
110         vbe_init_ver = VBE_VER_MAJOR(vbe.ver);
111         return 0;
112 }
113
114 void cleanup_video(void)
115 {
116         free(vmodes);
117 }
118
119 struct video_mode *video_modes(void)
120 {
121         return vmodes;
122 }
123
124 int num_video_modes(void)
125 {
126         return num_vmodes;
127 }
128
129 struct video_mode *get_video_mode(int idx)
130 {
131         if(idx == VMODE_CURRENT) {
132                 return curmode;
133         }
134         return vmodes + idx;
135 }
136
137 int match_video_mode(int xsz, int ysz, int bpp)
138 {
139         int i, best = -1;
140         struct video_mode *vm;
141
142         for(i=0; i<num_vmodes; i++) {
143                 vm = vmodes + i;
144                 if(vm->xsz != xsz || vm->ysz != ysz) continue;
145                 if(SAME_BPP(vm->bpp, bpp)) {
146                         best = i;
147                 }
148                 if(vm->bpp == bpp) break;
149         }
150
151         if(best == -1) {
152                 fprintf(stderr, "failed to find video mode %dx%d %d bpp)\n", xsz, ysz, bpp);
153                 return -1;
154         }
155         return best;
156 }
157
158 int find_video_mode(int mode)
159 {
160         int i;
161         struct video_mode *vm;
162
163         vm = vmodes;
164         for(i=0; i<num_vmodes; i++) {
165                 if(vm->mode == mode) return i;
166         }
167         return -1;
168 }
169
170 void *set_video_mode(int idx, int nbuf)
171 {
172         unsigned int mode;
173         struct video_mode *vm = vmodes + idx;
174         struct cpuid_info cpu;
175
176         if(curmode == vm) return vpgaddr[0];
177
178         printf("setting video mode %x (%dx%d %d bpp)\n", (unsigned int)vm->mode,
179                         vm->xsz, vm->ysz, vm->bpp);
180         fflush(stdout);
181
182         mode = vm->mode | VBE_MODE_LFB;
183         if(vbe_setmode(mode) == -1) {
184                 mode = vm->mode;
185                 if(vbe_setmode(mode) == -1) {
186                         fprintf(stderr, "failed to set video mode %x\n", (unsigned int)vm->mode);
187                         return 0;
188                 }
189                 printf("Warning: failed to get a linear framebuffer. falling back to banked mode\n");
190         }
191
192         /* unmap previous video memory mapping, if there was one (switching modes) */
193         if(vpgaddr[0] && vpgaddr[0] != (void*)0xa0000) {
194                 dpmi_munmap(vpgaddr[0]);
195                 vpgaddr[0] = vpgaddr[1] = 0;
196         }
197
198         curmode = vm;
199         if(nbuf < 1) nbuf = 1;
200         if(nbuf > 2) nbuf = 2;
201         pgcount = nbuf > vm->max_pages ? vm->max_pages : nbuf;
202         pgsize = vm->ysz * vm->pitch;
203         fbsize = pgcount * pgsize;
204
205         printf("pgcount: %d, pgsize: %d, fbsize: %d\n", pgcount, pgsize, fbsize);
206         printf("phys addr: %p\n", (void*)vm->fb_addr);
207         fflush(stdout);
208
209         if(vm->fb_addr) {
210                 vpgaddr[0] = (void*)dpmi_mmap(vm->fb_addr, fbsize);
211                 if(!vpgaddr[0]) {
212                         fprintf(stderr, "failed to map framebuffer (phys: %lx, size: %d)\n",
213                                         (unsigned long)vm->fb_addr, fbsize);
214                         set_text_mode();
215                         return 0;
216                 }
217                 memset(vpgaddr[0], 0xaa, pgsize);
218
219                 if(pgcount > 1) {
220                         vpgaddr[1] = (char*)vpgaddr[0] + pgsize;
221                         backidx = 1;
222                         page_flip(FLIP_NOW);    /* start with the second page visible */
223                 } else {
224                         frontidx = backidx = 0;
225                         vpgaddr[1] = 0;
226                 }
227
228                 blit_frame = blit_frame_lfb;
229
230                 if(read_cpuid(&cpu) != -1 && cpu.feat & CPUID_FEAT_MTRR) {
231                         print_mtrr();
232                         enable_wrcomb(vm->fb_addr, fbsize);
233                 }
234
235         } else {
236                 vpgaddr[0] = (void*)0xa0000;
237                 vpgaddr[1] = 0;
238
239                 blit_frame = blit_frame_banked;
240         }
241
242         /* allocate main memory framebuffer */
243         if(resizefb(vm->xsz, vm->ysz, vm->bpp, vm->pitch) == -1) {
244                 fprintf(stderr, "failed to allocate %dx%d (%d bpp) framebuffer\n", vm->xsz,
245                                 vm->ysz, vm->bpp);
246                 set_text_mode();
247                 return 0;
248         }
249
250         fflush(stdout);
251         return vpgaddr[0];
252 }
253
254 int set_text_mode(void)
255 {
256         /* unmap previous video memory mapping, if there was one (switching modes) */
257         if(vpgaddr[0] && vpgaddr[0] != (void*)0xa0000) {
258                 dpmi_munmap(vpgaddr[0]);
259                 vpgaddr[0] = vpgaddr[1] = 0;
260         }
261
262         vga_setmode(3);
263         curmode = 0;
264         return 0;
265 }
266
267 void *page_flip(int vsync)
268 {
269         if(!vpgaddr[1]) {
270                 /* page flipping not supported */
271                 return vpgaddr[0];
272         }
273
274         vbe_swap(backidx ? pgsize : 0, vsync ? VBE_SWAP_VBLANK : VBE_SWAP_NOW);
275         frontidx = backidx;
276         backidx = (backidx + 1) & 1;
277
278         return vpgaddr[backidx];
279 }
280
281
282 static void blit_frame_lfb(void *pixels, int vsync)
283 {
284         if(vsync) wait_vsync();
285         memcpy64(vpgaddr[frontidx], pixels, pgsize >> 3);
286 }
287
288 static void blit_frame_banked(void *pixels, int vsync)
289 {
290         int sz, offs;
291         unsigned int pending;
292         unsigned char *pptr = pixels;
293
294         if(vsync) wait_vsync();
295
296         /* assume initial window offset at 0 */
297         offs = 0;
298         pending = pgsize;
299         while(pending > 0) {
300                 sz = pending > curmode->bank_size ? curmode->bank_size : pending;
301                 //memcpy64((void*)0xa0000, pptr, sz >> 3);
302                 memcpy((void*)0xa0000, pptr, sz);
303                 pptr += sz;
304                 pending -= sz;
305                 vbe_setwin(0, ++offs);
306         }
307
308         vbe_setwin(0, 0);
309 }
310
311 static uint32_t calc_mask(int sz, int pos)
312 {
313         uint32_t mask = 0;
314         while(sz-- > 0) {
315                 mask = (mask << 1) | 1;
316         }
317         return mask << pos;
318 }
319
320 #define get_msr(msr, low, high) \
321         asm volatile( \
322                 "\r\trdmsr" \
323                 : "=a"(low), "=d"(high) \
324                 : "c"(msr))
325
326 #define set_msr(msr, low, high) \
327         asm volatile( \
328                 "\r\twrmsr" \
329                 :: "c"(msr), "a"(low), "d"(high))
330
331 #define MSR_MTRRCAP                     0xfe
332 #define MSR_MTRRDEFTYPE         0x2ff
333 #define MSR_MTRRBASE(x)         (0x200 | ((x) << 1))
334 #define MSR_MTRRMASK(x)         (0x201 | ((x) << 1))
335 #define MTRRDEF_EN                      0x800
336 #define MTRRCAP_HAVE_WC         0x400
337 #define MTRRMASK_VALID          0x800
338
339 #define MTRR_WC                         1
340
341 static int get_page_memtype(uint32_t addr, int num_ranges)
342 {
343         int i;
344         uint32_t rlow, rhigh;
345         uint32_t base, mask;
346
347         for(i=0; i<num_ranges; i++) {
348                 get_msr(MSR_MTRRMASK(i), rlow, rhigh);
349                 if(!(rlow & MTRRMASK_VALID)) {
350                         continue;
351                 }
352
353                 get_msr(MSR_MTRRBASE(i), rlow, rhigh);
354                 base = rlow & 0xfffff000;
355                 mask = rlow & 0xfffff000;
356
357                 if((addr & mask) == (base & mask)) {
358                         return rlow & 0xff;
359                 }
360         }
361
362         get_msr(MSR_MTRRDEFTYPE, rlow, rhigh);
363         return rlow & 0xff;
364 }
365
366 static int check_wrcomb_enabled(uint32_t addr, int len, int num_ranges)
367 {
368         while(len > 0) {
369                 if(get_page_memtype(addr, num_ranges) != MTRR_WC) {
370                         return 0;
371                 }
372                 addr += 4096;
373                 len -= 4096;
374         }
375         return 1;
376 }
377
378 static int alloc_mtrr(int num_ranges)
379 {
380         int i;
381         uint32_t rlow, rhigh;
382
383         for(i=0; i<num_ranges; i++) {
384                 get_msr(MSR_MTRRMASK(i), rlow, rhigh);
385                 if(!(rlow & MTRRMASK_VALID)) {
386                         return i;
387                 }
388         }
389         return -1;
390 }
391
392 static void enable_wrcomb(uint32_t addr, int len)
393 {
394         int num_ranges, mtrr;
395         uint32_t rlow, rhigh;
396         uint32_t def, mask;
397
398         if(len <= 0 || (addr | (uint32_t)len) & 0xfff) {
399                 fprintf(stderr, "failed to enable write combining, unaligned range: %p/%x\n",
400                                 (void*)addr, (unsigned int)len);
401                 return;
402         }
403
404         get_msr(MSR_MTRRCAP, rlow, rhigh);
405         num_ranges = rlow & 0xff;
406
407         printf("enable_wrcomb: addr=%p len=%x\n", (void*)addr, (unsigned int)len);
408
409         if(!(rlow & MTRRCAP_HAVE_WC)) {
410                 fprintf(stderr, "failed to enable write combining, processor doesn't support it\n");
411                 return;
412         }
413
414         if(check_wrcomb_enabled(addr, len, num_ranges)) {
415                 return;
416         }
417
418         if((mtrr = alloc_mtrr(num_ranges)) == -1) {
419                 fprintf(stderr, "failed to enable write combining, no free MTRRs\n");
420                 return;
421         }
422
423         mask = len - 1;
424         mask |= mask >> 1;
425         mask |= mask >> 2;
426         mask |= mask >> 4;
427         mask |= mask >> 8;
428         mask |= mask >> 16;
429         mask = ~mask & 0xfffff000;
430
431         printf("  ... mask: %08x\n", (unsigned int)mask);
432
433         disable();
434         get_msr(MSR_MTRRDEFTYPE, def, rhigh);
435         set_msr(MSR_MTRRDEFTYPE, def & ~MTRRDEF_EN, rhigh);
436
437         set_msr(MSR_MTRRBASE(mtrr), addr | MTRR_WC, 0);
438         set_msr(MSR_MTRRMASK(mtrr), mask | MTRRMASK_VALID, 0);
439
440         set_msr(MSR_MTRRDEFTYPE, def | MTRRDEF_EN, 0);
441         enable();
442 }
443
444 static const char *mtrr_names[] = { "N/A", "W C", "N/A", "N/A", "W T", "W P", "W B" };
445
446 static const char *mtrr_type_name(int type)
447 {
448         if(type < 0 || type >= sizeof mtrr_names / sizeof *mtrr_names) {
449                 return mtrr_names[0];
450         }
451         return mtrr_names[type];
452 }
453
454 static void print_mtrr(void)
455 {
456         int i, num_ranges;
457         uint32_t rlow, rhigh, base, mask;
458
459         get_msr(MSR_MTRRCAP, rlow, rhigh);
460         num_ranges = rlow & 0xff;
461
462         for(i=0; i<num_ranges; i++) {
463                 get_msr(MSR_MTRRBASE(i), base, rhigh);
464                 get_msr(MSR_MTRRMASK(i), mask, rhigh);
465
466                 if(mask & MTRRMASK_VALID) {
467                         printf("mtrr%d: base %p, mask %08x type %s\n", i, (void*)(base & 0xfffff000),
468                                         (unsigned int)(mask & 0xfffff000), mtrr_type_name(base & 0xff));
469                 } else {
470                         printf("mtrr%d unused (%08x/%08x)\n", i, (unsigned int)base,
471                                         (unsigned int)mask);
472                 }
473         }
474         fflush(stdout);
475 }